前后两次 AI 与人类的公开对弈,让大家意识到人工智能已不再是科幻电影的幻想。但惊叹 AlphaGo 出色战绩和表现同时,网上也出现不少意见指其实 AlphaGo 有意隐藏实力,故意让人类输得不难看。就笔者在乌镇现场观察,中国媒体似乎对该议题相当感兴趣,多次向 DeepMind 团队提出类似的问题。到底 AlphaGo 是否真的有自我意识并示弱?且看研究团队如何回应。
AlphaGo 有意识隐藏实力?只是最大化获胜概率
先前《AlphaGo 进步神速》的报导中提到,AlphaGo 能屡屡击败人类顶尖棋手,在于其先进的机器学习算法,即策略网络和价值网络的结合分析,以对手的绝对胜利到 AlphaGo 的绝对胜利为标准,预测所有可行落子位置的结果再选择最佳位置。因此对于 AlphaGo 是否有意识控制赢子数的疑惑,DeepMind 研究团队在赛后解释。
DeepMind 的联合创始人兼 CEO Demis Hassabis 表示,AlphaGo 的目标总是将获胜概率最大化放在第一位,它会透过寻找确定的搜索途径实现最低风险的获胜机会。
▲ David Silver。
DeepMind 研究科学家兼 AlphaGo 团队负责人 David Silver 补充,简单而言,AlphaGo 会将获胜概率尽量扩大,以求在对弈中取胜,而进一步扩大胜出的距离(子数)是未来需加强的地方。但目前而言,AlphaGo 的行为会倾向为了取胜而放弃更多赢子数,只为了降低不能取胜的风险,即使是很小的差距仍会纳入考虑(可理解为面对“赢 3 子,90% 胜率”和“赢 1/4 子,95% 胜率”两种情况,AlphaGo 倾向选择后者来降低风险)。
DeepMind:强大人工智能阶段尚需数十年发展
Demis Hassabis 在演讲中提到围棋不像象棋等游戏靠计算,而是靠直觉,AlphaGo 明显已展示出其具备一定创造力,能在预测落子位置时拥有类似人类棋手的直觉。不过,他认为 AlphaGo 在经过不断强化学习训练后,虽然可在围棋这个领域实现类似的直觉,但始终与人类的自主意识有差别。
▲ Demis Hassabis。
他续称,DeepMind 在 AI 应用上仍处于早期探索阶段,即使是在演讲中提及的医疗、新型药物研制等领域也只是行业中的其中一小部分。要发展到强人工智能阶段,相信尚需数十年的发展。
(本文由 Unwire Pro 授权转载)
延伸阅读:
- 柯洁为何说“输得没脾气”?8 个问题解读人机大战第一局
- 柯洁完败,输 1/4 子是 AlphaGo 事先设定好的?
- 人机围棋大战首局落幕,柯洁以 1/4 子之差输给 AlphaGo