欢迎光临GGAMen游戏资讯




Google 翻译大突破:实现语音对语音的直接翻译功能,并重现原讲者声音

2024-11-02 208

Goolge 翻译是不少人日常生活的好用工具,但很少人知道它其实是好几个工具组合起来的产品。

日常生活中要实现语音对语音翻译,常要先语音辨识为文字 (Speech-to-Text,STT),再用机器学习将文字转城目标语言文字,最后将文字“念出来”(Text-to-Speech,TTS)。这 3 段过程其实都需花时间做运算,每一步骤都有机会发生错误,使最终的翻译成品出错。Google 日前公布新的 Translatotron 翻译模型,除了直接声音对声音的翻译方式,节省翻译时间,还能保留原讲者的声音。

Google 展示新的声音对声音翻译流程,想要打破传统三阶段瀑布流方式的问题:时间长、每步骤会累积错误导致整体翻译出问题。Translatotron 提出片段对片段的网络模型来处理资料,维持讲者的声音和韵律,并且提高翻译内容准确度。

Google Research 表示,新的翻译演算模型翻译准确性,仍比不上传统的瀑布流流程。但是新模式有运作更快的好处,还能避免机器产生语音时,生硬的机器音。

▲ Google Research 提出的 Translatotron 翻译流程。 (Source:Google)

Translatotron 的技术部分有发表论文,详细分享如何实作。有兴趣的人,可以到 Google Research 的 GitHub 页面体验不同语音翻译方式,还有 Translatotron 采用模式,比较实际翻译的语音的差异。

  • Google’s Translatotron can translate speech in the speaker’s voice
  • Google’s Translatotron is an end-to-end model that mimics human voices
  • Google’s Translatotron converts one spoken language to another, no text involved
  • Google’s Translatotron translates speech directly to speech

(首图来源:pixabay)

2019-05-17 06:29:00

标签:   游戏头条 资讯头条 ggamen科技资讯 ggamen科技 ggamen科技资讯头条 科技资讯头条 ggamen游戏财经 新闻网 科技新闻网 科技新闻 ggamen ggamen游戏新闻网 科技新闻 科技新闻网 ggamen游戏财经 科技资讯头条 ggamen科技资讯头条 ggamen科技 ggamen科技资讯 资讯头条 ggamen游戏新闻网 科技新闻 科技新闻网 新闻网 ggamen游戏财经 科技资讯头条 ggamen科技资讯头条 ggamen科技 资讯头条 游戏头条
0