过去一年间,OpenAI 在《Dota 2》游戏已接连打败了一般玩家和半职业战队,但在 8 月 22 日《Dota 2》的 The International 8(TI8)年度赛事,全新的“OpenAI Five”队伍却接连输给职业战队,结束今年度的 TI8 旅程,看来要取代人类主宰电子游戏,AI 或许还有很长一段路要走。
据了解,这次 TI8 为 OpenAI Five 举办了两场表演赛,分别对上巴西知名战队 paiN Gaming 及中国元老玩家组成的队伍 Big God,由于先前的辉煌战绩,许多人都看好 OpenAI Five 能与职业队伍一较高下,但最终 OpenAI Five 却两场赛事都输给了人类。
谈论这次比赛以前,我们不妨先来了解一下 OpenAI Five 与《Dota 2》游戏究竟是什么。
OpenAI Five 是 5 个人工神经网络组成的团队,是非营利 AI 研究机构 OpenAI 专门为学习 Dota 2 所设计。就像人类玩家,这些神经网络也是从对 Dota 一无所知开始学习,它们将 Dota 世界视为 2 万个数字列表,并透过可见数字来理解游戏现状(为求公平,AI 也仅限解读人类玩家可看到的讯息)。
与人类玩家不同的是,OpenAI Five 必须传送 8 个数字列表来选择动作,设计者编写的代码只是使其在游戏状态、操作和数字列表间对照,经过训练后,这些神经网络虽拥有记忆,但也不会在游戏中进一步学习,同时尽管身为一个“团队”,神经网络之间并没有特殊的沟通桥梁,只有开发者提供的奖赏来激励。
至于《Dota 2》,是一款典型的多人线上战斗竞技(MOBA)游戏,在一般游戏情况下,两只队伍会各有五名队员,目标都是摧毁敌人基地内的“遗迹”,双方队伍经常会在地图争取优势的过程中发生零星战斗,一局的游戏时间约在 40 分钟。
说起电子游戏与 AI 对战,许多人可能会认为理所当然会由 AI 获胜,但其实 MOBA 是相当需要团队合作的游戏,这两次比赛的结果似乎也显示这种情况。两场人机大战中,比赛分别持续 51 分钟和 45 分钟,OpenAI Five 在游戏初期都一度领先,不论金钱或人头都有更好的表现,然而战略层面则展示了一些奇怪的行为,像是在 Roshan(注)的巢穴外一直不走,让对手趁机在地图其他地区取得优势,或是在一些奇怪的时间点选择施放强大法术。
注:Roshan 是需要团队合作才能打败的强大生物,击杀 Roshan 能获得优势,反之会损失资源。
游戏中明显可看出,人类玩家在一些需要计算的地方不如 AI,但相反的战略部分,AI 也比不上人类玩家,这似乎反应出 AI 与人类在学习游玩 Dota 2 的差异──尽管我们计算理所当然比不上电脑,但即时思考的灵活度人类还是略胜一筹。
OpenAI 技术人员 Filip Wolski 告诉 The Register,相较先前的比赛,他们对于赢得这场比赛更没自信,因为职业选手毕竟是更艰难的挑战。“输掉比赛令人失望,但我很高兴能与顶级战队相互拉扯这么长时间。”
Congratulations to Team paiN, the Dota 2 pro team who just beat OpenAI Five in a 51 minute game. Lots of extremely exciting plays by both teams. Has been a great showcase of what both humans and AIs can do.
— Greg Brockman (@gdb) 2018年8月23日
当然必须一提的是,双方此次对战都有一些让步,举例来说,AI 目前可掌握游玩的英雄只有 18 人,为了节省时间并确保平衡,双方团队的角色都已由主办方和 OpenAI 预选,同时也减少游戏一些变数,而 AI 代理的反应时间也从 0.08 秒增加到 0.2 秒,为人类玩家提供机会。
随着 OpenAI 持续研究,未来双方应该能在更公平的情况下较量,届时究竟谁能胜出,也就更引人期待。
- OpenAI bots smashed in their first clash against human Dota 2 pros
- Humans grab victory in first of three Dota 2 matches against OpenAI
(首图来源:达志影像)
延伸阅读:
- DOTA 5v5 AI 亮点不是如何“学”,而是如何“教”
- 5 个 AI 合作无间,OpenAI 打《DOTA 2》电竞团体战击败人类
- 马斯克的 OpenAI 击败《Dota 2》职业电竞选手