全世界只有 20% 的使用者以英文为主要语言,网络上却有 50% 以上的内容以英文产出,因此很多时候我们在使用网络或日常生活中经常以 Google翻译 为常驻工具,看到不同的语言时也会很自然地说“找 Google翻译”,而这次的 Google 机器学习座谈会正是来谈谈关于神经网络与 Google翻译 之间如何相辅相成。
就如同前面提到,以英文为母语人口比例和网络产出内容比例不成正比,所以 Google翻译 的服务中每天进行超过 10 亿次翻译,每个月有超过 10 亿个活跃用户,更有高达 92% 的流量来自美国以外的地区与国家。
为了能够更便利地提供多方位的翻译服务,Google 翻译整合了其他包含 Chrome、Google搜寻、Gmail 与 YouTube ,使用者只要在 Google 搜寻列输入或用语音输入想要翻译的内容即可进行语言翻译,目前台湾更是 Android 版本 Google翻译 成长最快的市场。
虽然 Google翻译 已经为我们提供这么多服务,但在翻译结果上总是与实际有差异,有时还会出现语焉不详的诡异文字,未来 Google翻译 将导入神经机器翻译技术(NMT),借由系统端对端机器学习系统持续优化精进,以带给使用者更自然、精准的翻译结果。
在神经机器翻译系统中,一甩过去片段式翻译的作业,借由具备多层“神经元(neurons)”的“深度神经网络(deep neural network)”一次针对整个句子做翻译,让系统学习识别句子中的模式和结构,最后翻译出的语法会更贴近日常对话内容更顺畅且更易于阅读。
▲在过去,Google翻译 是以单字或片段词语来进行
▲ 词组式机器翻译就像拼图,以现有存在的片段进行组合,而神经机器翻译则像绘图,以全局且前后连贯地针对整个句子进行组合。
神经机器翻译的教育并非一朝一夕可以完成,也非与生俱来的能力,必须经过多种模型反复不断地训练间才能累进经验进而成长。
▲目前大家已经能够实际体验的神经机器翻译系统应用包含 Google翻译应用程序中的即时镜头翻译功能。
目前已有 41 组语言组合导入神经机器翻译系统,包含英 / 中、英 / 泰、英 / 韩 、英 / 俄罗斯、英 / 印、英 / 法、英 / 德、英 / 西、英 / 葡、英 / 土耳其、英 / 越 之间的互译,未来还将陆续增加更多语言组合,神经机器翻译技术预计将在三年内正式推出。