传统上新闻主播的条件不只需要口语清晰、长相端正而已,还需要具备一定的公信力,能够给人专业、信任感觉的人,但是现代新闻娱乐化下,各家媒体几乎已经放弃这道原则,使得主播台上只是一台念稿机器,再这样下去,主播这个工作迟早会被机器人取代,现在中国就开发所谓的虚拟主播,虽然做得差强人意,但拟真度已经比 3D 制作的电脑合成影像好很多。
根据新华社和南华早报的报导,新华社和中国搜索引擎公司搜狗合作开发两个主播,一个用于英语播报,一个用于中文。新华社表示,这些主播前景无限,且新闻播报成本将大幅降低。新华社强调,每个主播都可以在官方网站和各种社交媒体平台上一天 24 小时工作,降低新闻制作成本、提高效率。特别是在即时突发新闻报导需求上特别有用。
新华社的虚拟主播是在现在在浙江乌镇举行的第五届世界互联网大会上宣布的,在搜狗人工智能核心技术“搜狗分身”支持下,采用人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等多项尖端技术,并结合语音、图像等多模态资讯进行联合建模训练,所生成与真人无异的人工智能分身。
但 The Verge 观察表示,目前还不清楚究竟是采用什么技术,但不外乎有机器学习技术。而看来新华社使用人类主播的连续镜头作为基础,然后使用动画制作口腔和脸部表情变成虚拟人偶,再与合成语音结合,新华社可以对数位主播进行编码以阅读新闻,这比使用传统的电脑生成影像要快得多。
根据新华社公布的影片,很明显虚拟主播脸部表情很僵硬,并且声音显然是合成的。牛津大学教授 Michael Wooldridge 接受 BBC 采访时说很难看这个影片超过几分钟,因为整体非常扁平、没有节奏或重点,而且新闻节目主持人在传统上是高度信任的公众人物,也是新闻台的重要资产,如果观众只是看动画,就完全失去与主播的联系。
搜狗声称虚拟主播能够帮助媒体在融媒体转型、新闻时效性和跨语言传播能力等方面再上台阶。The Verge 认为这个领域的机器学习研究正在迅速进步,并且不难想像未来的人工智能主播与真实的主播将无法区分。
- China’s state-run press agency has created an ‘AI anchor’ to read the news
- China’s Xinhua agency unveils AI news presenter
- Xinhua News Agency debuts AI anchors in partnership with search engine
(首图来源:影片截图)