Google 人工智能(AI)技术再进化,该公司宣布能让机器人说话语调不再生硬,听来和人类难辨真假。
PhoneArena、Quartz、每日邮报报导,Google 部落格宣称,开发出第二代文字转语音系统“Tacotron 2”,能让机器说话声音没有怪异、不自然之处,听来几乎和人类一模一样。机器会依据语意学决定正确发音,文章略有拼写错误也能顺利读出,而且就连绕口令都难不倒。
(Source:Google)
Google 人员表示,外界认为 Tacotron 2 表现类似专业人员。民众给 Tacotron 2 的平均意见分数(Mean Opinion Score)是 4.53 分,只略低于专业人员录制声音的 4.58 分。
Tacotron 2 包括两个深度类神经网络,第一个网络会把文字转成声谱图,用图像表达音频,接着把声谱图输入 WaveNet 系统中,机器会照图发出相应声音(Tacotron 2 与人类声音对照点此)。
不过 Google 表示,Tacotron 2 仍有许多地方需要改进,包括无法读出部分难字,无法即时合成音频;机器声音没有情绪,不能传达快乐或悲伤的感觉。
尽管如此,此一技术仍大有可为,目前 Google 虚拟语音助理已用 WaveNet 技术发声,若能进一步采用 Tacotron 2,可让 Google 助理如虎添翼。
(本文由 MoneyDJ新闻 授权转载;首图来源:shutterstock)
延伸阅读:
- 谷歌AI击败棋王后再进化!会开口说话、语调超像真人