看过蒙娜丽莎开口说话吗？三星开发新 AI 模型，只需几张图片便能造假成动态影片 04月20日更新

要打造令人信服的 deepfakes 影片，神经网络模型往往需要经过大量数据训练才能达成，但现在三星（Samsung）莫斯科 AI 研究中心的团队已经开发出一种方法，只需要“少许”影像数据就能打造出可信度相当高的谈话影片。但少许究竟是多少？根据团队的描述，这个数字可以是 32 张或 8 张照片，又或者更少一些──1 张照片也行。

据了解，这款 AI 模型是使用卷积神经网络（CNNs）所打造，团队先是使用 VoxCeleb 公开数据库中超过 7,000 张名人图像对算法进行了训练，让 AI 关注于辨识人们脸部的“地标”特征，像是眼睛、嘴巴形状、鼻梁长度和形状，它开始能以相似的做法应用在其他照片上，使照片活过来。

由于 AI 模型最少只需要 1 张照片便可以进行，这意味着历史人物或肖像画都能够适用，在影片中，可以看到爱因斯坦、杜斯妥也夫斯基和梦露的著名肖像动起来，就好像他们在现代生活，被一旁友人拍下讲话的画面一样。

▲ 想看历史人物、画像人物动起来的可直接移动至 4:18 处。

当然，使用越多照片的效果明显越好，只使用 1 张照片制作的 deepfakes 影片很容易就能从背景、脸部表情的不自然看出造假痕迹，只是随着使用的对象生活年代越早，也越难从影片中看出虚假──毕竟许多人在摄影技术普及前早已离世，并没有留下实际的谈话影片让我们能够对照真伪。

要说这个 AI 模型最让人惊艳的一点，应该还是让画像人物也能够动起来的部分，以知名的“蒙娜丽莎”为例，过去即使前往卢浮宫美术馆朝圣，顶多也只能感觉蒙娜丽莎像从任何角度都在看着你，可没有办法看到蒙娜丽莎对你眨眨眼，又或者像是在谈起生活琐事。

▲ 在造假技术协助下，画像中的人物就像被赋予了生命。

随着 deepfakes 技术越来越进步，许多人都开始担心相关技术被应用在恶意用途，让未来即使看到影片、听到声音档仍“眼见不能为凭”。尽管潜在疑虑仍然存在，但至少以目前来说，还未有任何 deepfakes 影片造成严重的混乱事件──当然，这是目前啦，未来会如何发展就不好说了。

Deepfakes are getting easier than ever to make, new research paper shows
arXiv 论文预印本－Few-Shot Adversarial Learning of Realistic Neural Talking Head Models

（图片来源：arXiv via Egor Zakharov）

看过蒙娜丽莎开口说话吗？三星开发新 AI 模型，只需几张图片便能造假成动态影片

延伸阅读：

热门推荐

《还愿》回来了！有游戏还有童书，台湾限定实体版开放预购

《还愿》游戏从 Steam 下架！开发商赤烛：维护品质进行检测

《还愿》遭中国网友抵制、团队道歉、中国代理商终止合作，销量反冲高

我们的肉眼每秒能够捕捉多少画面？

最新内容

十年后全球锂电池产能高达 1.3TWh，亚太仍是生产重地

小脑其实并不小，研究：只有可丽饼厚，皱褶拉平长达 90 公分

全球最快！荣总团队 7 天就能找出新生儿听损原因

废弃火箭应已撞向月球，NASA 绕月飞行器预计 3 月中进行成像

聚焦电动车散热工程方案，高柏科技推出一条龙散热对策服务

金价触 2,000 美元大关，普丁盟友哈萨克原油也遭回避

303 停电惩处出炉，台电董事长杨伟甫准辞、王美花续留

真实版钢铁擂台！新北、鸿海合办世界级 FRC 机器人区域大赛

心诚镁结盟台耀、台新药！攻全球呼吸治疗药 CDMO 商机

高龄者打疫苗送 500 元内赠品！网传打三剂返台免隔离为假讯息

关于我们

新闻资讯

意见反馈

网站地图