虽然近年来,AI 已经在一些领域发挥超越人类的能力,例如计算、下棋、逻辑推理等,但仍然有许多功能还无法与人脑比拟。近期美国南加州大学研究团队发表了一项研究成果,展示了可以发挥想像力的 AI 系统,让机器学习领域出现新的突破。
▲ 目前的 AI 虽然能够产生完美的虚拟人脸,但无法模拟人脸以外事物。(Source:The Verge)
在人的脑中,可以自由的根据过往经验,以及人事物的各项特质,凭空想像出不同的场景、动作与画面,但对于机器来说是一项非常困难的任务,因此南加州大学(University of Southern California,USC)团队,在今年度“国际机器学习展示会议”(International Conference on Learning Representations,ICLR)发表 AI 想像力系统。
“人类的大脑可以轻易的解构过往学习到的人事物,并且根据不同的特征-例如形状、姿态、位置和颜色等,重新合成现实不存在的新图像。”团队中的博士生 Yunhao Ge 表示,透过人工神经网络技术,他们设计出一套可以发挥想像能力的 AI 系统。
目前的 AI 系统,如果要自动产生某种图像,例如人脸,必须先设计出一套算法,并提供一定数量的人像,让机器透过算法学习人脸的各项特征,之后就能够自行产生各种虚拟人像。但现有技术的限制在于,系统虽然可以产生无数的虚拟人像,但无法产生与人无关的事物,或是让虚拟的人处在不同情境中。
研究团队使用机器学习“脱钩”(Disentanglement)的概念,这项概念最著名的运用就是“Deepfake”技术,Deepfake 可以将不同人事物的外形、动作和情境分开学习,并用算法重新创造出一组虚拟的人事物,且进行不同的动态。
因此团队舍弃传统算法使用的单张图片学习方式,一次用一组互无关联的图片,让 AI 运用脱钩概念进行特征分析,从而创造出 AI 进行想像的能力,团队称这种想像力为“可控脱钩图像学习”(Controllable Disentanglement Representation Learning)。
▲ 带领研究团队的南加大教授 Laurent Itti。(Source:USC)
“透过算法,AI 能够随意的把变形金刚里面的大黄蜂、柯博文与时代广场结合起来,产生大黄蜂颜色的柯博文卡车在时代广场旁行驶的图片。”领导团队的 Laurant Itti 博士表示,这项成果相较于传统的图像产生 AI 来说,有更多联想能力,能把更多元素同时带进算法,让机器产出更丰富的画面。
团队同时也指出,这项技术对医药领域也有相当大潜力,透过 AI 脱钩联想能力,机器能同时分析成千上万种不同药物或生化物质的特性,并透过分析与重组,合成出新的药物配方,大量减少新药物研发的时间,可为人类健康带来许多帮助。
- AI Uses Human-Like Capabilities to Imagine the Unseen
(首图来源:USC)