让闽南语能直接译成英语是怎么做到的?工程师来揭秘
此前,Meta推出了全球首款以语音对语音的翻译技术,让闽南语能直接翻译成英语。近日,参与此项技术开发的中国台湾工程师陈鹏仁,通过线上的形式,分享了更多此项技术背后故事。
陈鹏仁
陈鹏仁表示,选择闽南语作为第一个开发翻译语言的原因,其实在于开发团队中有不少熟稔闽南语的同仁,因此可以在更快时间里验证翻译结果是否正确、通顺。而为了打造能直接以语音对语音的翻译技术,多达50人规模的开发团队除了工程师,还包含语言学者、社会学家以及伦理学家等诸多跨学术团队成员,以此研究目标翻译语言背后结构与文化影响。例如美国所使用的英语与英国地区的英语虽然互通,却有不少用字遣词,或是发音上的差异。
Meta打造的翻译系统
而闽南语其实也有类似情况,光是在台湾、福建沿海地区,与马来西亚、新加坡等地所使用的闽南语就有不少差异,甚至闽南语还有七声八调的不同。此外,闽南语实际上没有标准化的文字系统,加上各地区发音用词上的差异,让这个原本是以口语相传为主的语言,更难以制式翻译的方式转换成其他语言。
陈鹏仁表示,实际上也是开始投入开发之后,才发现要顺利将闽南语翻译成其他语言,真的比想像中还难。先前说明中,Meta是透过闽南语的念音转换成数字资料,然后将这些资料进行分类、标示,并且通过机器学习训练,让其他语言可以对应合适的翻译结果。若其中有无法直接翻译,或是难以呈现精准意思的情况,系统就会通过其他相近语言进行翻译,并且将翻译结果转换成目标语言。
不过,目前此项技术仍受限算法、学习资料内容等限制,因此仅能做到逐句翻译,暂时还无法对应流畅的对话。但陈鹏仁预期在日后累积更多可用于训练的语库资料,加上算法技术的持续进步,将能实现更即时的语音互译效果。