Deepmind 今年稍早“一战成名”,在中国乌镇围棋峰会上,AlphaGo 战胜了世界冠军柯洁九段。在这之后,我们知道 Deepmind 会把 AlphaGo 的技术运用在疾病诊断等造福人类的领域。
所以,Deepmind 最近在做什么“高大上”的事呢?
……他们在教 AI“跑酷”。
最近,Deepmind 放出一段“搞笑影片”。其中的火柴人看似将以酷炫的动作翻越路上的障碍物,但不幸演出各类“花式摔跤”。在影片中,还有 4 条腿的“蚂蚁”和只有身体和腿的“走路器”。
Deepmind 表示,这些小人的动作都是 AI 控制的。在 AI 的帮助下,小人能做走路、跳跃等一连串动作,甚至能模仿行动不便的老人走路的样子。
为什么 Deepmind 的 AI 不下围棋,而是开发新爱好“跑酷”呢?
Deepmind 发表的文章中,研究人员称“跑酷”和围棋在目的上显著不同,这点就是他们希望 AI 学习的。研究人员这么解释:
在一些 AI 问题中,比如玩雅达利(Atari)的游戏和下围棋,目标非常容易定义──就是赢。但你如何解释后空翻的目标?或跳跃动作?
在训练自动化系统运动时,如何向 AI 清楚解释复杂动作,是经常遇到的问题。
在实验中,研究人员在火柴人的必经之路上摆放“矮墙”、松动的“地砖”等障碍物。AI 控制的小人在一次次翻越障碍不成功后,也学会了如何“安全”跑到终点。
Deepmind 将这项技能形容为:
我们的实验对象在不接受指令的情况下演化出复杂技能。这是一个能用于训练系统不同、模拟人体运动的技术。
Deepmind 补充,他们采用一种“回馈学习算法”(reinforcement learning algorithm)。这种算法能帮助未来 AI 在不同环境中灵活自然地运动。
在研究者的眼中,人工智能控制的灵活行为是人工智能拥有“运动智慧”的指标。在这技术的助力下,电脑很快就能胜任更复杂的工作,甚至变得和人类越来越像。
▲ 你走路时是这样吗?
Deepmind 对这项技术有不少期望。研究者在文章最后写道:
未来,我们可以将这些技术运用在复杂环境中,调控更多(机器)行为。
调控一大堆模仿人类行为的机器?听起来它们能做很多事,比如说……组成一个《西方极乐园》般的游乐园?所以,Deepmind 今天还在花式摔跤的火柴人,能变成明日《西方极乐园》里心思缜密、行动灵活的机器人吗?
- Producing flexible behaviours in simulated environments
(本文由 36Kr 授权转载;首图来源:影片截图)
延伸阅读:
- Google AI 眼科医师在印度“开业”,要协助糖尿病患筛检视网膜病变
- 《西方极乐园》的道德难题:机器人能否享有与人类同等的权利?