哪张是照片哪张是 AI 合成？DeepMind 新技术让照片真假更难分辨 04月20日更新

人工智能（AI）造假的技术已引起人们的关注。就目前来说，除了没有评断标准的绘画，人们还是非常轻易就能看出 AI 生成的造假图片，然而随着时间过去、AI 技术持续发展，未来要区分真实和虚假的东西将会变得越来越难。

最近 DeepMind 和英国赫瑞瓦特大学（Heriot-Watt University）研究团队运用对抗式神经网络（GAN）创造出的机器学习模型 BigGANs 便再度提高了 AI 生成图片的质量，创造出首图可见到的所有图片。

在视觉影像数据库 ImageNet 接受 128×128 分辨率的训练后，BigGANs 在衡量真实度的 Inception Score（IS）大幅超越以往最高得分 52.52，达到与真实影像分数 233 十分接近的 166.3。

单以数字来说可能有些难以体会，我们不妨从下面几张图片来感受一下 BigGANs 的实力。在下面几张组合图片中，分别都有一张 BigGANs 生成的图片混在其中，你看得出来哪些是由 AI 产生的图吗？

▲ 你分得出来 AI 创作的狗、蝴蝶和汉堡分别是哪一个吗？（详见附注）

如果看图片久一点，你或许可以看到 BigGANs 创作的图片中有些轻微异常；像是狗狗的眼睛混浊，蝴蝶的翅膀上有奇怪的斑块等，然而以整体来说，这些图片仍旧是截至目前为止 AI 以假乱真的最好创作。

BigGANs 能获得更真实结果的诀窍之一，是让模型训练量变得更大。arXiv 上刊载论文显示，每个模型都需要 128~512 个 Google TPU 3.0 Pod 在 1~2 天内进行训练，训练参数大约是现有技术的 2~4 倍，批次（batch）大小则达到 8 倍。

Brock 强调，要创造令人信服的图片，神经网络必须学习构成人们视觉世界的复杂结构，“你必须‘理解’事物才能描绘它。如果我们能够建立完全理解的模型，那么我们可以用它们学到的表现做很多有趣的事情。”

▲ BigGANs 还是会有失败作品产生，像这张融合网球与狗的图片就无法骗过任何人。

诀窍之二，则是将输出变量控制在更小的范内。由于生成器（generator）的输出是由输入的变化程度控制，透过减少输入的可变性，研究人员让 BigGANs 创造更类似训练数据的图片，质量更高并更真实。

在许多其他研究，我们都可以看到 GAN 技术用在人脸图或影像造假，除了让奥巴马（Barack Obama）、川普（Donald Trump）等政治家说出他们没有说过的话，一些人甚至将类似的技术应用于色情影片修改。

Brock 表示，他也担心恶意使用 GANs 技术的情况，这也是为什么团队选择专注在更一般的图片，而不是人脸建模。“比起人物图片，要把狗网球图片用于政治或不道德的目的要困难得多。”

（图片来源：arXiv 论文）

哪张是照片哪张是 AI 合成？DeepMind 新技术让照片真假更难分辨