Hardcore 级的电玩高手要小心了,继国际象棋后,有机会打败你们的人工智能已经诞生。Google 拥有的人工智能研发公司 DeepMind,仅利用一台电脑的演算能力,展现了如何学习 49 款街机游戏,其中包含史上第一款街机游戏《乓》(Pong,上图) 与经典《太空侵略者》(Space Invaders),而其中已有一半游戏,人工智能的功力已经可以打败真人高手。
这套首次于 2013 年发表的算法,是第一套针对不同目标(游戏)学习,且在一开始只需要给少量资料就能自行运作的算法。美国詹姆斯麦迪逊大学 (James Madison University) 人工智能专家 Nathan Sprague 说,一套系统就能学习不同游戏,且转换之间不需要调整什么,这是多么令人印象深刻的事。
虽然 IBM 的“深蓝”(Deep Blue) 于 1997 年就已经击败当时的世界国际象棋王卡斯波洛夫 (Garry Kasparov);不久前加拿大也开发出一款德州扑克人工智能算法,号称“在公平的游戏中不会输”,但他们都有一个限制:只精通一款游戏。
这项发表在“自然”杂志的最新成果,DeepMind 其实是结合两套人工智能学习系统而成。第一种叫“深度学习”(Deep Learning),将可以加强累积经验的模拟神经元,以多层次方式组合并连接在一起,这与脑部神经细胞彼此用突触连接的方式很像。深度学习系统可以从大量没有结构化的资料中获取复杂的资讯,Google 的翻译及照片分类功能就是采用类似的架构。
▲《太空侵略者》
第二种叫“强化学习”(reinforcement learning),是一种模仿神经传递物质“多巴胺”运作的决策系统,它收集游戏画面中的像素资料与得分,判断进行什么动作可以得到较多分数,例如往左、往右或是射击;套句电玩术语,“练功”,也就升级了。
DeepMind 共同创办人 Demis Hassabis 表示,神经学家一直在研究人类的智能及决策过程,这套灵感来自大脑运作方式发展出的算法,正好可以协助进行这方面的研究。像 Google 这样的公司本身当然也需要不断精进的人工智能系统,协助他们判断如何以最有效益的方式投放广告或聚焦内容;而对于实体机器人来说,当然可以让他们更聪明地与真人及环境互动。
DeepMind 的下一步也令人眼睛一亮。研究团队计划加入记忆功能,让算法有“触类旁通”的能力,也就是说,目前的版本其实是算法各自在学 49 款游戏,彼此的学习结果并没有互通,有了记忆能力,很多“白工”可以省下。另一个计划则是把 DeepMind 变成“眼光短浅”的家伙。因为目前的算法都是着眼于一个“遥远”的目标,研究团队必需要让它具备解决更小规模目标的能力,才有办法玩像《小精灵》(Ms. Pac-Man) 这种迷宫游戏。
▲《小精灵》
(图片来源:Wikimedia Commons)
相关资讯
- Human-level control through deep reinforcement learning
- Game-playing software holds lessons for neuroscience