人工智能(AI)造假的技术已引起人们的关注。就目前来说,除了没有评断标准的绘画,人们还是非常轻易就能看出 AI 生成的造假图片,然而随着时间过去、AI 技术持续发展,未来要区分真实和虚假的东西将会变得越来越难。
最近 DeepMind 和英国赫瑞瓦特大学(Heriot-Watt University)研究团队运用对抗式神经网络(GAN)创造出的机器学习模型 BigGANs 便再度提高了 AI 生成图片的质量,创造出首图可见到的所有图片。
在视觉影像数据库 ImageNet 接受 128×128 分辨率的训练后,BigGANs 在衡量真实度的 Inception Score(IS)大幅超越以往最高得分 52.52,达到与真实影像分数 233 十分接近的 166.3。
单以数字来说可能有些难以体会,我们不妨从下面几张图片来感受一下 BigGANs 的实力。在下面几张组合图片中,分别都有一张 BigGANs 生成的图片混在其中,你看得出来哪些是由 AI 产生的图吗?
▲ 你分得出来 AI 创作的狗、蝴蝶和汉堡分别是哪一个吗?(详见附注)
如果看图片久一点,你或许可以看到 BigGANs 创作的图片中有些轻微异常;像是狗狗的眼睛混浊,蝴蝶的翅膀上有奇怪的斑块等,然而以整体来说,这些图片仍旧是截至目前为止 AI 以假乱真的最好创作。
BigGANs 能获得更真实结果的诀窍之一,是让模型训练量变得更大。arXiv 上刊载论文显示,每个模型都需要 128~512 个 Google TPU 3.0 Pod 在 1~2 天内进行训练,训练参数大约是现有技术的 2~4 倍,批次(batch)大小则达到 8 倍。
Brock 强调,要创造令人信服的图片,神经网络必须学习构成人们视觉世界的复杂结构,“你必须‘理解’事物才能描绘它。如果我们能够建立完全理解的模型,那么我们可以用它们学到的表现做很多有趣的事情。”
▲ BigGANs 还是会有失败作品产生,像这张融合网球与狗的图片就无法骗过任何人。
诀窍之二,则是将输出变量控制在更小的范内。由于生成器(generator)的输出是由输入的变化程度控制,透过减少输入的可变性,研究人员让 BigGANs 创造更类似训练数据的图片,质量更高并更真实。
在许多其他研究,我们都可以看到 GAN 技术用在人脸图或影像造假,除了让奥巴马(Barack Obama)、川普(Donald Trump)等政治家说出他们没有说过的话,一些人甚至将类似的技术应用于色情影片修改。
Brock 表示,他也担心恶意使用 GANs 技术的情况,这也是为什么团队选择专注在更一般的图片,而不是人脸建模。“比起人物图片,要把狗网球图片用于政治或不道德的目的要困难得多。”
注:三张影像最左上角的图片都是由 BigGANs 所生成。
- I like BigGANs but their pics do lie, you other AIs can’t deny
(图片来源:arXiv 论文)
延伸阅读:
- 换脸换花换云都行,Recycle-GAN 让影像转换更简单真实
- 除了一键生成明星色情片,“AI 换脸”的应用场景还有很多