百度AI技术虽然在国际上还谈不上顶尖但亦多方面发展,从面部识别、语音识别到实时语音翻译,百度已经连续三年入选 MIT 全球十大突破技术榜,并在“全世界最聪明公司”中排名第二。作为 AI 技术的先行者,百度AI“ Deep Voice”只需听一个人说话一分钟,就能模仿其嗓音,与真人声音无异。
据英国《每日邮报》报导,以 AI 为基础驱动力的百度不断完善核心业务,实现了从“人找信息”到“信息找人”的转变,为百度带来新的商业模式,为移动营销提供了新的解决方案。而“Deep Voice”是百度 AI 研发的一个完全由深度神经网络构建的高质量语音转文本系统,可以分析并学习发言者交谈时的声音特质,从而“复制”出发言者的合成语音。
目前“Deep Voice”研究人员已经用2400人的声音样本对该 AI 进行了800多小时的训练。现在,通过分析100段5秒的声音片段它就可以完全复制一个人的声音,而且只用10段5秒的声音片段就可以有95%的概率通过语音识别系统的测试。而该技术可以用于帮助丧失发声能力的人重新“发声”,为电子游戏中的上百个虚拟角色配上各具特色的真人语音。但这个开发又是否突破了声纹识别安全认证呢?值得深究一下。