Meta宣布计划建立一个由AI驱动的“通用语音翻译器”
Meta CEO马克·扎克伯格在一次在线演讲中说道:“用任何语言跟任何人交流的能力--这是人们永远梦想的超级能力,而AI将在我们有生之年实现这一目标。”
这家公司表示,尽管像英语、普通话和西班牙语这样的常用语言在目前的翻译工具中得到了很好的照顾,但世界上约有20%的人口不讲这些系统所涵盖的语言。通常情况下,这些服务不足的语言没有训练AI系统所需的容易获得的书面文本语料库,或有时根本没有标准化的书写系统。
Meta指出,它希望通过在两个特定领域部署新的机器学习技术来克服这些挑战。第一个重点被称为“不落下任何语言(No Language Left Behind)”,它将专注于建立AI模型,进而使其能利用更少的训练实例学习翻译语言。第二个重点是“通用语音翻译(Universal Language Translotr)”,目的是建立直接将语音从一种语言实时翻译成另一种语言的系统而无需书面组件作为中介(这是许多翻译应用的常用技术)。
在宣布这一消息的博文中,Meta的研究人员没有提供完成这些项目的时间框架,甚至没有提供实现其目标的主要里程碑的路线图。相反,该公司强调了通用语言翻译的乌托邦式的可能性。
他们写道:“消除语言障碍将会是深远的,使数十亿人有可能以他们的母语或偏好的语言在线获取信息。(机器翻译)的进步不仅会帮助那些不会说今天在互联网上占主导地位的语言之一的人,它们还将从根本上改变世界上人们联系和分享想法的方式。”
至关重要的是,Meta还设想,这种技术将极大地有利于其横跨全球的产品--进一步扩大其影响并将其变成数百万人的基本通信工具。博文指出,通用翻译软件将成为未来可穿戴设备如AR眼镜(Meta正在研发)的杀手级应用,也将打破沉浸式VR和AR现实空间(Meta也在开发)的界限。换言之,开发通用的翻译工具可能有人道主义的好处,对于像Meta这样的公司来说,它还有良好的商业意义。
当然,近年来机器学习的进步极大地提高了机器翻译的速度和准确性。从Google到苹果的一众大型科技公司,现在为用户提供免费的AI翻译工具用于工作和旅游,这无疑在世界各地提供了不可估量的好处。但底层技术也有其问题,批评者指出,机器翻译错过了对人类说话者至关重要的细微差别,在其输出中注入了性别偏见,并且还会抛出那些只有计算机才会出现的奇怪、意外的错误。一些说不常见语言的人还称,如果翻译他们的语言的能力完全由大科技控制,那么他们担心会失去对他们的语言和文化的控制。
当Facebook和Instagram这样的大型平台自动应用这种翻译时,考虑这种错误至关重要。比如考虑到2017年的一个案例,一名巴勒斯坦男子在Facebook的机器翻译软件错误地翻译了他分享的帖子后被以色列警察逮捕。该男子用阿拉伯语写了“早上好”,但Facebook将其翻译为英语的“伤害他们”和希伯来语的“攻击他们”。
虽然Meta长期以来一直渴望实现全球访问,但该公司自己的产品仍然偏向于提供其大部分收入的国家。作为Facebook Papers的一部分公布的内部文件显示了该公司如何努力缓和除英语以外的其他语言的仇恨言论和虐待。这些盲点可能会产生令人难以置信的致命后果。而涉及有问题的翻译的类似案例至今仍占据着Facebook的监督委员会。
虽然通用翻译器是一个令人难以置信的愿望,但Meta不仅要证明其技术可以胜任这一任务,而且作为一家公司它还可以公平地应用其研究。