在 Facebook 创办人兼 CEO Mark Zuckerberg 发文对外宣称将让其发展的人工智能能在围棋比赛中打败人脑之际,Google 却已经先一步达成目标,而且对外发表的时间还差没多久,看来在人工智能这环,Google 已完全抢在前头。
训练人工智能系统最佳的利器就是玩游戏,如此一来,系统就能发展出更聪明且弹性化的算法,让它更贴近人类的思惟模式。然而,自人工智能发展几十年以来,科学家所研发的人工智能系统已能打败许多由人类操作的游戏,却没有办法突破起源于中国的古老游戏─围棋。Google 为了打破这样的迷思,研发出一套人工智能系统 AlphaGo,期望能跨越围棋对人工智能发展所树立的障碍。
围棋创立至今已超过 2,500 年,规则虽简单却能有超过 10 的 700 次方种的局面的变化,每一步棋都可能让盘面翻转,下棋的人需要缜密的思虑才有可能赢过敌方,连孔子都曾称赞过下棋的美学。但也因这变换多端的局面,围棋成为了科学家最头痛的桌上游戏,该怎么研发出够细心的人工智能系统,打败人类操控的棋局,更是研发中的难处之一。
目前为止,现有的人工智能系统只能达到与围棋业余等级差不多的程度,专家更认为,至少要花上将近 10 年的时间,才能让人工智能追赶上并打败专业的围棋选手。Google 更在 27 日在部落格上对外表示,他们将打败围棋专业选手视为一个不可抗拒的挑战,目前正着手研发了一套人工智能系统 AlphaGo。
这套系统的关键,就在减少原先在搜寻时所占用的庞大空间,转而变成较能掌握的事情。而为了要能达成这样的效果,AlphaGo 结合最新的树状搜寻技术与两种深度学习网络,其中,每一种网络都有非常多层涵盖了百万种像神经一般的连结。其一深度学习网络称为“策略网络(policy network)”,能够预测下一步并缩小搜寻范围,让接下来的每一步都能朝致胜更迈进。另一个则是“评估网络(value network)”,能减少在树状搜寻时的深度,评估赢家在每一个情况下最好的下法。
AlphaGo 突破了以往的人工智能系统,算法又更贴近人类的思惟,Google 不使用 Facebook 研发人工智能时所运用的蒙地卡罗树状搜寻(MCTS),反而用了机器学习来引领 AlphaGo 的搜寻。透过上述的两种机器学习网络,AlphaGo 比其他系统更能抉择出更好的下一步,引领自己在围棋比赛中胜出。
Google 在训练 AlphaGo 时,先以人类专家下围棋的 3,000 万种步骤训练“策略网络”,直到此人工智能系统能准确预测 57% 人类下棋的步骤。但 Google 也不以此满足,不达赢过人类玩家的目的永不罢休。为了达到目的,Google 让 AlphaGo 的“策略网络”玩好几千把的围棋,并在这过程中习得自己发现新下棋策略的能力,再搭配强化学习的方式逐渐改进下棋的方式。最后,Google 更骄傲的表示,AlphaGo 目前已能打败所有用树状搜寻所建立的人工智能系统。
更厉害的是,这个接受过训练的“策略网络”,还能反过来训练 AlphaGo 中的“评估网络”,让它能评估所有围棋中可能出现的局面,进而评估最后的赢家会是谁,颠覆了原本被认为不可能发生的事情。
然而,要想达到这样的结果必须要有非常强大的运算能力,所以 Google 团队更运用了 Google 云端平台,让这些研究人工智能与机器学习的学者能随时弹性的运算、储存以及取得网络容量。除此之外,有了运用数据曲线图的数字运算新开放源代码数据库,就能允许研究学者在不同的 CPU 和 GPU 上,更有效的支配其学习算法的运算方式。
而为了证明 AlphaGo 能赢过市面上其他的人工智能系统,Google 更用它来与其他系统玩游戏,结果证明,即使 AlphaGo 让他们四步还是能赢过所有的系统。除此之外,AlphaGo 还推出了高性能版本,其成效更可以说是无人能敌。
▲ Google 制作 AlphaGo 程度图表。(Source:Google Research Blog)
Google 并不以此满足,他们要的是能击败真人的人工智能系统。于是,他们邀请了曾经赢得 3 届欧洲围棋杯冠军的樊麾与 AlphaGo 竞赛。樊麾自 12 岁起就开始接触围棋,生涯中赢得的奖杯已不可数,更是围棋界中的佼佼者。在 2015 年 10 月 5-9 日进行的比赛中,樊麾却以 0:5 的比数惨败给 AlphaGo,这也成为计算机程序率先赢过专业围棋选手的第一例。
▲ AlphaGo 与樊麾竞赛的影片。(Source:Google)
而 AlphaGo 下一个挑战就是要与在过去 10 年间最顶尖的围棋选手李世乭比赛,这场比赛将于今年 3 月在韩国首尔举行。李世乭也很兴奋的接受挑战并表示:“我很高兴我成为能与他对决的选手,但我也很有信心我能赢得这场比赛。”而这绝对将会是一场史无前例的比赛。
Google 也在最后表示,他们很开心能打造出 AlphaGo 这套系统,但他们并不想让它被定位成一个手工打造的专家系统,而是一种借由纯粹的观赏与玩游戏的方式,运用机器学习让它能改进自己的下棋技巧的人工智能系统。他们最终想完成的并不只是玩游戏而已,而是要能将人工智能运用在解决真实世界的问题中,帮助人类解决烦恼。
-
AlphaGo: Mastering the ancient game of Go with Machine Learning
(首图来源:Flickr/Chad Miller CC BY 2.0)
延伸阅读:
- Facebook 人工智能系统新目标:和人类比下围棋
- Netflix 创办人:未来将会是基改人类与人工智能的竞赛
- Google 老板 Eric Schmidt:开发人工智能的 3 个原则