自从 Deepfake 技术面世以来,就一直朝着不可控的方向发展。
从开始用在成人电影换成女明星的脸,到美国总统川普、Facebook CEO 祖克柏等公众人物相继成为 Deepfake 技术的受害者,再到“一键脱衣”的 App“DeepNude”,Deepfake 技术带来的负面影响愈加明显。
更令人担心的是,Deepfake 技术还在进化。史丹佛等几所学校发表研究,甚至能篡改影词组句,只要输入任意文本,就能让影片中的讲者说出对应的话,比如将电视台主持人报导的“苹果股价收盘于 191.45 美元”数字改为“182.25 美元”。
尽管这两个词的发音和口型完全不同,但几乎看不出修改痕迹。研究者经过调查发现,59.6% 受试者认为修改过的影片是真的,这项技术成功骗过大部分人的眼睛及耳朵。
Deepfake 技术让网络世界变得更真假难辨,与此同时不少科学家和机构也开始研发鉴定 Deepfake 的技术,开始一场猫捉老鼠的游戏。
据《华尔街日报》报导,本周在拉斯维加斯举办的黑帽网络安全大会,俄勒冈大学研究人员提出,老鼠等小动物未来或有助于鉴定伪造的影片和音频。
研究人员发现,老鼠在辨识自然语音元素方面很有天分,能听出声音中的不规则性,比如透过训练能区分 P、B、T 等不同音素,以及不同元音发声的区别,进而辨识复杂的声音,并检测音频的真实性。
科学家以条件反射训练小老鼠,让老鼠在听到真实和合成影片的时候分别跑向不同位置,如果辨识正确就给予奖励,测试过程老鼠辨识假音频的准确率达 75%。
虽然当研究人员添加新声音和元音的等变量后,老鼠辨识准确率有下降,但又经过一段时间训练后,还是能区分新的语音模式。
研究计划成员之一、俄勒冈大学研究生 Jonathan Saunders 认为,还可以进一步优化,形成通用版本 Deepfake 检测算法,但这需要更深入了解大脑如何分析和处理声音。
尽管老鼠在听觉研究领域有很大潜力,但这也不意味社交平台和影像网站将来透过饲养大量老鼠就能鉴定 Deepfake 假影片。研究人员希望透过明白老鼠如何辨识假音频,进而更容易训练机器对抗 Deepfake 。
除了之外,很多研究团队都采用生成式对抗网络(GAN)鉴定 Deepfake,以 AI 对抗 AI。
前不久,加州大学柏克莱分校和南加州大学研究团队开发一套 AI 鉴别系统,先透过生成式对抗网络,提取川普、希拉里和奥巴马等人的脸部、头部运动特征,合成假影片。
随后再用机器学习分析真假影片的差异,得到每个人的“软性生物特征”(soft biometric signature),辨识出细微的动作特征,这种检测工具辨识 Deepfake 影片的准确率达 95%,研究人员希望未来半年内提升至 99%。
去年美国国防部研究机构 DAPRA 也研发出专门打假 Deepfake 的 AI 工具,抓住 AI 生成人脸缺乏眨眼功能的缺陷,透过检测眼睛状态判断影片的真假,准确率高达 99%。
▲ 原始影片(上图)中,6 秒内检测到眨眼动作。而 Deepfake 生成的假影片(下图)没有眨眼。 (Source:纽约州立大学奥尔巴尼分校)
遗憾的是,这套工具无法大规模应用,研究人员试图开发出可扩展的平台化工具,能鉴定网络大量影片。
不过这种利用 AI 对抗 AI 的鉴定方式也有问题,因为生成式对抗网络的原理就是让两套神经网络相互博弈中学习,随着鉴定技术的提升,假影片的品质也会提高,两者永远不断对抗,谁也无法彻底打败谁。
同时比起 Deepfake 技术的研发,鉴定技术的科研力量显得有点势单力薄。据 DeepTrace 平台统计,2018年,全球涉及 GAN 生成图像和影片的论文多达 902 篇,研究如何辨识合成图像和影片的论文只有 25 篇。
加州大学柏克莱分校的电脑科学家 Hany Farid 也指出,目前研究合成影片和鉴定人数是 100:1,Farid 认为依靠技术现有的鉴定技术难以阻止 Deepfake 影片在社交平台传播:
解决方法不能只靠技术,还需要媒体专业的报导,以及更好的数位公民、公司和政策。
- In fighting deep fakes, mice may be great listeners
(本文由 爱范儿 授权转载;首图来源:pixabay)
延伸阅读:
- 担心被 AI 换脸技术祸害?Deepfake 纠察队正在赶来