2022-07-07 09:47:07

Meta声称在“超级”人工智能翻译方面取得了突破,它可以翻译200多种语言

自动通用翻译一直是科幻小说的梦想。Facebook母公司meta的人工智能研究人员发表的一篇新论文声称朝着这一目标迈出了一步。

这篇论文表明,人工智能背后的技术——机器学习,可以翻译204种不同的语言,是以前尝试的两倍,质量也比以前更高。

其中包括一百多种很少使用的语言,如印度尼西亚的亚齐人的语言和中非和南非的乔克维人的语言,这些语言一直很难用电脑翻译,因为它们在网上很少出现。

Facebook和meta首席执行官马克·扎克伯格称赞了这一壮举,称人工智能翻译是一种“超级力量”,而研究人员自己也只是稍微不那么热情。

这是人工智能领域的最新进展。人工智能是一个备受争议的科学领域,最近在一名谷歌工程师声称聊天机器人可以表达思想和感觉后被停职。

约翰霍普金斯大学的菲利普·科恩教授是这项研究的38名学者和元研究人员之一,他说:“这篇论文展示了令人印象深刻的工作,将生产水平的翻译质量提高到200种语言。”

“还将释放大量资源,让每个人都可以使用这种模式,并自行对其进行再培训,促进该领域的研究。”

“所以,是的,我认为这是一件非常重要的事情。”

然而,尽管这篇论文声称它“为实现通用翻译系统奠定了重要的基础”,但没有参与该项目的计算机科学家强调,这只是漫长曲折道路上的一小步,看不到明显的终点。

“令人印象深刻的工程壮举”

爱丁堡大学自然语言处理专业的读者亚历山德拉·伯奇-梅恩博士说,这篇论文的核心机器学习技术——一种被称为“专家稀疏门控混合”的巴洛克式模型——本身并不新鲜。

她说,它最大的贡献是汇集、清理和呈现有关在互联网上没有广泛出现的语言的新数据,而互联网是机器翻译的主要数据来源。

“这是一个令人印象深刻的工程壮举。这并不一定是基础科学方面的突破,”伯奇-梅恩博士告诉天空新闻。

除了翻译语言使用者较少的语言,该报纸还声称为翻译质量设立了新的标准。

数据和算法将公开

衡量机器学习的进展是一项具有挑战性的任务,但通过一种名为BLEU的指标,这篇元论文的翻译质量比之前的最先进水平提高了44%。

萨里大学自然语言处理人工智能讲师迪普特什·卡诺贾博士说:“BLEU是一个不完美的指标。”“然而,在自然语言处理研究中,引用BLEU分数是一种标准做法。”

“如果我们单纯从统计角度来看这种改善,44%的改善是相当显著的。”

虽然这项工作将用于改进Facebook的软件,但用于翻译的语言数据和算法将向公众开放,这意味着将首次有关于东意第绪语、北库尔德语和佛得角克里奥尔语等语言的权威数据集供其他研究人员使用。

重要的是,元研究人员发现母语使用者会检查他们的翻译,这是一项耗时的任务,有助于保护算法的质量和底层语言数据。

“让人敬佩的是参与社区活动。他们不一定是这一趋势的发起者,但他们遵循了良好的做法,”伯奇-梅恩博士说。他同时指出,这项研究的局限性在于,该研究的对象是欧洲和美国的母语使用者,而不是该语言的母语国家。

一些研究人员批评了这篇论文在没有同行评议的情况下发表的事实,指责meta在实践“通过媒体进行同行评议”。

科恩教授为这种方法进行了辩护,称这是“该领域的常见做法……无论好坏”,并有助于提高研究结果的传播速度。

机器学习的进展

这篇论文是机器学习最近取得的诸多进展之一,机器学习的进步速度远远快于研究人员的预期。上周谷歌发布的一个模型解决了麻省理工学院三分之一的本科生数学问题,准确率为50%,成绩显著提高。

然而,尽管每一次新的突破都带来了对新意识形式的猜测,但该领域的大多数人认为,人工智能系统既没有感知能力,也没有智能,它们只是模仿给定的数据。机器人**是不可能的。

人工智能系统更大的危险在于,它们会让人类对自己仍然非常有限的能力产生错误的信心,从而导致灾难——考虑到Facebook可能涉及翻译的任务的敏感性,这一前景非常现实。过去,Facebook曾因没有以母语为母语的管理员来发现其平台上的暴力呼吁而受到批评。

扎克伯格承诺,“我们在这方面的进步将使我们的应用程序每天有超过250亿的翻译”,Facebook表示,这可能包括发现有害内容、确保选举安全以及遏制在线性剥削。

伯奇-梅恩博士刚刚与英国广播公司合作,在非洲和印度完成了一个为期三年的17种语言项目,他告诫说,在任何精确度非常重要的事情上,不要使用机器翻译。

“你不能依赖这些系统,”她说。“这可能是对的,但也可能不是。”