抖音上的网红一定都是真人吗?答案还真不一定。最近国外出现了一批贩售“假人”的网站,针对所有人开放,只要付费就能透过 API 快速获取一个假人 IP,而且也不贵,一个 2.99 美元。
先来看看它们的成品。
这些拥有光滑皮肤的人脸照,是不是像极了社群平台的网红照?可能你会怀疑他用了美颜相机瘦脸了,但肯定想不到他们都是不存在的“假人”
不只如此,这个名为 Generated.Photos 的网站还为购买者提供了极大的发挥空间,不管是年龄、容貌、肤色、种族、性别,甚至是情绪,统统都可以根据需求调整,而调整方法就像使用美颜 App 一样简单。
比如想要变大双眼,直接滑动下面的滚动按钮即可。
从青年直接跨到老年,头发、神情、皱纹,呈现相当自然,还应景地配了副眼镜。
情绪变化也毫无违和感。
如果一张假人照不足为奇,那么一个名为 Rosebud.ai 的网站还能让他们“动”起来。
从说话的嘴型、五官的轻微移动,确实很难分辨真假。
从网站介绍来看,任何带有面孔的照片都可以变成影像,其中说话的文本可自定义,也可由系统自动提供,同时,说话者的声音有多种选择模式。
那么,如此逼真的深度造假网站,是不是已经被封杀?
然而并没有,这是一家公司网站,网站上还挂出了他们的客户 LOGO──莱雅(L’OREAL)、电商平台(shopify)、YC 中国(Y-Combinator)等大牌企业。
Rosebud.ai:为艺术创作而生
想必很多 AI 开发者或爱好者,对上述“假人”的生成效果并不感到意外。
自从 2014 年 GAN(生成式对抗网络)首次被提出以来,基于人脸的图像合成效果便得到了惊人的发展,尤其是其升级版 StylGAN2 推出后,在人脸处理方面,已经能够支援换脸、换头、修改五官,甚至生成不存在的新人脸。
而且这项技术已经支援图像、影像、语音多种形式。据 Rosebud.ai 官网介绍,其“假人”制造正是基于 GAN 技术,而其音频的处理上利用的是自然语言模型 GPT-3.
GPT-3 具有超强的文本生成能力,内含 1,750 亿参数量,是有史以来最大的 NLP 模型,也是 OpenAI 耗资四百多万美元打造的模型。从 6 月开通 API 服务后,被网友们挖掘出了 50 多种新玩法,如写诗作词、画图做 PPT、生成代码等,效果十分惊人。
基于这两项超强 AI 技术,Rosebud.ai 可以达到的效果不难想像。而为何提供这样一种“假人”服务,该网站也给出明确说明:
Rosebud ai 是一款生成文本、图像、影片和语音的工具,它对于生成性媒体完成故事创作非常重要。比如,小说故事中的人物形象总是很丰富多彩,我们可以透过 AI 技术呈现与之最相符合人物容貌;同时,GPT3 能够进一步透过人物特点合成具有亲和力和情感丰富的独白,建立人物形象,丰富故事内容方式也发挥了非常重要的作用。
也就是说,这项技术原意是被用来辅助艺术创作。事实上,无论是 GPT-3 还是 GAN 技术,都是以科技向善为初衷研发的,比如 GAN 在人脸融合方面的惊人效果,可以被广泛应用于娱乐、电影制作等行业。
但有人曾说过,“技术本没有错,错的是利用技术的人”,GAN 技术被不少不良分子用来创造大量 Deepfake 影像,或是色情内容、伪造政客言论。
Rosebud ai 等工具也一样。
被间谍利用,用于身份造假
Rosebud ai 主要被人用来身份造假。相关案例也不在少数,其中最大的一起案例要属 2019 年某间谍利用假面孔混入华盛顿政治领域事件。
当时一个名叫凯蒂‧琼斯(Katie Jones)的红发女郎以网络专家的身份,与美国副国务卿助理、参议员助手以及经济学家保罗‧温弗里(Paul Winfree)都建立了密切联系,温弗里当时正在竞选美联储的职位。
后来经调查发现,这位 30 岁的女性是由 AI 创建的“假人”,她在职业社群平台 Linkedin 上的个人资料和照片全部都是虚构。
美国国家反情报与安全中心主任威廉‧埃文纳(William Evanina)曾表示,
“这是在专业社群网站上进行间谍活动的典型案例,很多外国间谍通常会使用虚假的社群媒体资料把自己包装成美国知名专家,并进行大规模间谍活动,对他们而言,相比派间谍到某一个国家,不如坐在家里的电脑前,向 30,000 个目标好友发送请求效果更高。”
不过,因及时发现,该事件并没有产生更恶劣的影响。同样是在 LinkedIn 平台,今年 7 月也发生了一起重大身份造假事件。
这位“假人”名为拉斐尔‧巴达尼(Raphael Badani),他将自己包装成美国知名新闻平台 Newsmax 的内部人员,从事“政治风险顾问、国际关系高级分析师”相关工作。
利用这个身份他发表过有关“伊拉克如何伊朗的控制”、“迪拜为何如此动荡”等多篇文章。这些文章还被美国 Washington Examiner、RealClear Markets、American Thinker 以及 The National Interest 等多家媒体转载。
但后来发现此人并不存在,其个人资料全部为伪造,文章也窃取自圣地牙哥创业公司创始人的部落格。
此外,与以上有政治意图的造假案例相比,该技术可能被广泛的应用于日常社群,虽然不会涉及违法犯罪,但它确实在构建一个虚假的世界。例如有网友称:
不难想像,未来我们会经常看到此类分享照──与“假朋友”聚会、与“假狗”闲逛,抱着他们的“假婴儿”。
仔细看,肉眼看也能辨识
当然,随着造假资讯的泛滥,相关反辨识技术也在陆续推出。
目前的主流技术包括人脸 X 射线( Face X-ray)检测、背景差异检测(Background Difference)、情绪辨识网络(Emotion Recognition Network)检测,以及生物学信号(Biological Signals)检测,最高辨识率可达到 99% 以上。
此外,目前的人脸造假,无论是影像还是图像方面,还远未达到毫无差错的地步。
如果用肉眼观察,也能够发现一些痕迹。比如透过一些首饰。
▲ 图中的耳环看起来很相似,但细心一点可以发现有明显区别。
另外眼镜也是一个常用的衡量配饰,GAN 创建的眼睛,框架两端经常会不对称,或有轻微变形。在对称方面,GAN 在耳朵、眼睛的生成上也会有不一致出现。
最后,最明显的痕迹就是伪影和背景。
伪影就是在原图像上出现了并不存在的各种形态的混色影像,这一点最容易辨识。伪影也是衡量合成图像品质的关键指标。此外,目标人脸之外的背景也是重点,如变形的树木、错位的草坪等。
- Designed to Deceive: Do These People Look Real to You?
- Experts: Spy used AI-generated face to connect with targets
- Right-Wing Media Outlets Duped by a Middle East Propaganda Campaign
(本文由 雷锋网 授权转载;首图来源:shutterstock)
延伸阅读:
- Instagram 开始阻挡假照片,结果误伤了一些创意作品
- 看过蒙娜丽莎开口说话吗?三星开发新 AI 模型,只需几张图片便能造假成动态影片
- 深伪影片流窜,恐加剧假新闻招致混乱
- AI 伪造色情影片流窜,女星 Scarlett Johansson 坦言无能为力
- Google 的超强 AI 工具,怎么会被拿来做换脸 A 片?