马斯克(Elon Musk)创立的人工智能公司 Open AI 最近有了新的突破,透过新型算法“一次性模仿学习”(one-shot imitation learning),Open AI 让机器人只需要看一次示范动作,就能成功克隆人类的行为。
Open AI 表示,透过一次性模仿学习,研究人员只需要在虚拟实境(VR)中示范一次动作,机器人就能透过相同的动作做出同样的结果。以这次的实验为例,在看过示范后,机器人就成功地将桌上分散的木块堆叠成相同形状。
Open AI 的机器人外观和普通机器手臂无异,搭载视讯镜头、手臂及夹爪三大部分,系统则由两大神经网络组成:视觉网络(Vision network)与模仿网络(Imitation network)。
Open AI 不采用真实影像,而是将数十万张具有不同纹理、光影的虚拟影像,透过镜头输入视觉网络来进行训练,模仿网络则透过观察示范内容,来推测出行为的目标,并进而实现出任务的意图。
但模仿网络究竟是如何学会推测的?Open AI 表示,他们先是用 10 几项不同的任务对模仿网络进行训练,每个任务都进行了数千次的虚拟示范,让模仿网络观察并学习推测,并逐渐学会在第一次示范动作时,就能有效理解任务的意图。
透过这两大神经网络系统,即使在启动参数不同的情况下,机器人也能够达成目标。
(Source:OpenAI)
以这次的示范来说,木块可以任意摆放在桌上的任何位置,如果示范的结果是蓝色木块于白色木块上方,机器人会找到在不同位置的蓝白木块,并确实地照顺序堆叠完成任务。
研究人员以婴儿为例,当看到成人在面前吐舌时,婴儿也会试着模仿吐舌,人类的模仿本能让学习事物能够非常快速,“我们也希望让机器人具备同种学习功能。”
- robots-that-learn
(首图来源:Flickr/Heisenberg Media CC BY 2.0)