教一次就会！Open AI 新算法让机器人学会“模仿” 04月30日更新

教一次就会！Open AI 新算法让机器人学会“模仿”

2025-04-30 213

马斯克（Elon Musk）创立的人工智能公司 Open AI 最近有了新的突破，透过新型算法“一次性模仿学习”（one-shot imitation learning），Open AI 让机器人只需要看一次示范动作，就能成功克隆人类的行为。

Open AI 表示，透过一次性模仿学习，研究人员只需要在虚拟实境（VR）中示范一次动作，机器人就能透过相同的动作做出同样的结果。以这次的实验为例，在看过示范后，机器人就成功地将桌上分散的木块堆叠成相同形状。

Open AI 的机器人外观和普通机器手臂无异，搭载视讯镜头、手臂及夹爪三大部分，系统则由两大神经网络组成：视觉网络（Vision network）与模仿网络（Imitation network）。

Open AI 不采用真实影像，而是将数十万张具有不同纹理、光影的虚拟影像，透过镜头输入视觉网络来进行训练，模仿网络则透过观察示范内容，来推测出行为的目标，并进而实现出任务的意图。

但模仿网络究竟是如何学会推测的？Open AI 表示，他们先是用 10 几项不同的任务对模仿网络进行训练，每个任务都进行了数千次的虚拟示范，让模仿网络观察并学习推测，并逐渐学会在第一次示范动作时，就能有效理解任务的意图。

透过这两大神经网络系统，即使在启动参数不同的情况下，机器人也能够达成目标。

（Source：OpenAI）

以这次的示范来说，木块可以任意摆放在桌上的任何位置，如果示范的结果是蓝色木块于白色木块上方，机器人会找到在不同位置的蓝白木块，并确实地照顺序堆叠完成任务。

研究人员以婴儿为例，当看到成人在面前吐舌时，婴儿也会试着模仿吐舌，人类的模仿本能让学习事物能够非常快速，“我们也希望让机器人具备同种学习功能。”

（首图来源：Flickr/Heisenberg Media CC BY 2.0）

教一次就会！Open AI 新算法让机器人学会“模仿”