谷歌采用神经网络驱动机器翻译,可离线翻译59种语言
2018年06月13日 由 浅浅 发表
981113
0
谷歌的在线翻译自2016年以来一直由神经机器翻译(NMT)驱动,今天,该公司推出了其神经网络驱动的方法,以便谷歌翻译的iOS和安卓应用用户能够更准确地实现59种语言的离线翻译。
谷歌产品经理Julie Cattiau表示,谷歌翻译小组与谷歌大脑团队一起使用TensorFlow完成了离线NMT。与其他谷歌应用不同,95%的谷歌翻译用户群不在美国境内,而在印度,巴西和印度尼西亚等国家。“所以我们从用户那里得到很多高质量的在线信息,但是他们中的很多人无法访问互联网连接,或者他们更愿意保存他们的数据计划。所以我们在过去的一年半时间里把它作为一项重点,将我们的NMT模型搭入人们的设备。”
与以前的机器学习方法通过扫描句子短语提供解释相比,NMT的离线翻译可以一次分析整个文本块,从而允许更自然、更和条理的声音,以及情境感知翻译。
连接到互联网时,谷歌翻译应用程序中的对话模式可以提供现场语音翻译。但是,NMT离线翻译是以纯文本翻译的形式发布,它不会扩展到翻译应用程序中的功能,比如解释拍摄的菜单或翻译声音。
为了使实时的语音翻译成为可能,谷歌必须使AI的其他元素结合起来,才能在离线状态下使用对话模式,比如语音识别以及将文字从文本合成到语音。
“这些部件中都需要在设备上进行构建,才能获得完整的体验,这绝对是我们想要推出的东西,”她说。“目前还没有确定日期,但文本翻译无疑是构建语音端到端离线翻译的基石之一。”
获得离线神经机器翻译不需要更新程序。之前下载了离线翻译软件包的用户将看到一条横幅,点击横幅就可以离线翻译,而新用户必须先进入该应用并选择他们想要离线使用的语言进行下载。每种语言包大约需要35-45 MB,大小与之前的离线包相当,但质量更高。
Cattiau说,“我们无法在低端手机上运行这些耗费大量计算能力的模型,因此需要工程师压缩模型并使其在非常低端的安卓设备上运行。这也是这次发布的挑战。”
用户应该注意到这与之前的离线翻译有所不同,但在线翻译仍然比离线翻译更准确,因为减少了语言包的空间。
与以前使用的基于短语的机器学习方法一样,NMT利用了数以亿计的文章,书籍,文档和搜索结果等示例翻译。
谷歌的语言能力不仅仅改进了翻译应用程序。Alphabet的子公司已承诺在今年年底前为谷歌智能助理提供30多种语言,这个数字远远超过支持4种语言的Alexa的和支持20种语言的Siri。