DeepMind打机已经劲过人类，57款游戏超越

2025-05-01 205

Atari(雅达利) 游戏作为经典的游戏始祖，玩家们的乐趣在于如何去获得最高的分数，打破记录。而近期，人工智能公司 DeepMind 在官方博客宣布了 AI 挑战 Atari 游戏的新进展，称在57款 Atari 游戏中实现全面超越人类，是该领域里的第一次。

在 DeepMind 最新发布的预印本论文和博客中称，他们构建了一个名为 Agent57 的智能体，通过在街机学习环境（Arcade Learning Environment，ALE）中学习，从而在 57 个 Atari 游戏中表现超越人类。如果 Agent57 智能体有如此优秀，那么将会为构建更加强大的 AI 决策模型奠定基础，可以进行自动推理环境，实现自动化提升生产力。

DeepMind 为什么选择用 Atari 游戏来进行测试呢？其实早在2012年，DeepMind 开发出 Deep Q-Network（DQN），同样是用于挑战 Atari 57款游戏。但当时不能克服四款比较难的游戏：Montezuma’s Revenge、Pitfall、Solaris 和 Skiing。

这一次同样采用游戏的一部分原因可能是想弥补缺憾，另一部分原因是 Atari 游戏的一些特点。据悉 Atari 有3个特点，第一是游戏足够多样性，可以用来评估智能体的泛化性能；第二是可以模拟真实环境中的情况；第三是因为 Atari 游戏由独立的组织构建，可以有效避免实验偏见。

除此之外，DeepMind 在博客上公布了 Agent57 的框架，采用强化学习算法，在多台电脑上运行。这可以让 AI 赋能的智能体选择最大化奖赏去执行指令。 OpenAI 的 OpenAI Five 和 DeepMind 的 AlphaStar RL 智能体分别打败过 99.4% 的 Dota 2 玩家和 99.8% 的星际2玩家。

Agent57 的学习过程是通过把众多 actor 信息汇总到可以采样的一个中央存储库中来进行学习。 DeepMind 团队为了更好的的学习，采用两种不同的 AI 模型来近似每个状态动作的价值（state-action value），价值能够决定智能体的执行指令好坏程度，从而提供评估标准，让智能体适应性选择使用哪种策略。

这个全新的框架模型有着两个优势，一是有着策略优先级选择，让 Agent57 去分配更多的网络容量；二是在评估时采用自然的方式来选择最佳策略。

Agent57 在与 MuZero、R2D2 和 NGU 等领先算法的比较中，总体上限更高。在训练 50亿帧后就可以在 51种游戏上超越人类，而在训练 780亿帧后可以在 Skiing 游戏上超越人类。

虽然 Agent57 已经在51种游戏上超越了人类，但是 DeepMind 团队并不满于此，向我们透漏了下一步计划“Agent57 最终在所有基准测试集最困难的游戏中都超过了人类水平。但这并不意味着 Atari 游戏研究的结束，我们不仅要关注数据效率，也需要关注总体表现……未来的主要改进可能会面向 Agent57 在探索、规划和信度分配上。”期待在未来，AI 能够带来更多生活上的便捷。

2020-04-05 17:03:00

标签: 游戏头条资讯头条 ggamen科技资讯 ggamen科技 ggamen科技资讯头条科技资讯头条 ggamen游戏财经新闻网科技新闻网科技新闻 ggamen ggamen游戏新闻网科技新闻科技新闻网新闻网 ggamen科技资讯头条 ggamen科技 ggamen科技资讯资讯头条游戏头条 ggamen ggamen游戏新闻网科技新闻新闻网 ggamen游戏财经科技资讯头条 ggamen科技资讯头条 ggamen科技资讯头条游戏头条

DeepMind打机已经劲过人类，57款游戏超越

热门推荐

《还愿》回来了！有游戏还有童书，台湾限定实体版开放预购

《还愿》游戏从 Steam 下架！开发商赤烛：维护品质进行检测

《还愿》遭中国网友抵制、团队道歉、中国代理商终止合作，销量反冲高

我们的肉眼每秒能够捕捉多少画面？

最新内容

"Metaphorical Fantasy: ReFantazio"latest new

"Persona 3 Reload".ON PC PS4

姐妹们 !我们村的咖啡馆老火了

库迪瑞幸价格战，小镇咖啡会受影响吗？

王者榮耀攻速暴擊流呂布銘文出裝

王者榮耀最強暴擊流李白怎麽出裝，暴擊流李白出裝銘文裝備推薦

王者榮耀國服夏洛特最強輸出流出裝連招銘文推薦

沒有2023年王者榮耀1月2日更新了什麽？最新改動具體內容

鬥羅大陸魂師對決千仞雪魂環搭配 sp千仞雪技能解析

鬥羅大陸魂師對決最強控製流陣容怎麽搭配？獨孤博阿銀控製流玩法

关于我们

新闻资讯

意见反馈

网站地图