玩德州扑克的“AlphaGo”来了，击败它可以拿走 20 万美元 04月12日更新

从 1 月11 日开始，5 名顶尖德州扑克选手将在匹兹堡的赌场展开争夺，不过，其中一名选手却不是人类。

在这项名为“人脑 VS. 人工智能”的对决中，4 名职业选手 Jason Lee、Dong Kim、Daniel McAulay 和 Jimmy Chou 将分别与卡内基美隆大学开发的“Libratus”人工智能系统进行挑战。赛程为期 20 天，总共将对战 12 万手牌，奖金为 20 万美元。

▲ Dong Kim 曾在 2015 年与卡内基美隆大学的 Claudico 对战过。（Source：CMU）

AI 与人类对决不是什么新鲜事，但是，重点来了，本次的比拼项目是德州扑克。

我们在下象棋或围棋的时候，能够看得到彼此手中的棋子、排兵布阵等，这种被称为“完整讯息博弈”。德州扑克则不同，每个玩家手中的底牌只有自己知晓，其他玩家是看不到的，所以是“非完整讯息”（Imperfect information）。

鉴于德州扑克独特的规则，AI 想要主宰比赛并没有那么容易。总之，与棋类游戏相比，德州扑克对于 AI 来说更具有挑战性，也是近来十分流行的人工智能测试项目。

卡内基美隆大学的 Libratus 采用的是一种名为“奈许平衡”的对战策略，在这一策略里，只要其他玩家的策略保持不变，单一玩家就无法透过变换策略获益。

Libratus 要做的就是辨识没有希望的策略，进而更快地找到奈许平衡点。经过反复的训练后，Libratus 已经能够忽略那些糟糕的路径了。

不过，Libratus 并非唯一一个会玩德州扑克的 AI，就在卡内基美隆大学宣布 Libratus 出战的几天前，加拿大阿尔伯塔大学抢先发表了关于扑克 AI 的论文，表示他们的 DeepStack 是世界上第一个在“一对一无限注德州扑克”上击败了职业扑克玩家的计算机程序。

上周，著名的论文网站 Arxiv 出现一篇题为《 DeepStack：无限下注扑克里的专家级人工智能》（DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker）的论文，作者是来自加拿大 Alberta 大学、捷克 Charles 大学、布拉格捷克理工大学的研究人员。

该论文显示，DeepStack 在与 33 名人类选手进行的 4.4 万手较量中，平均胜率为 492 mbb/g，一般认为人类玩家这一数据达到 50 mbb/g 就具有较大的赢面，而 750 mbb/g 就是对手每局都弃牌的节奏了。

值得一提的是，DeepStack 玩的是无限下注类的德州扑克，玩法比有限下注要复杂得多。

然而，DeepStack 虽然有先发优势，但明显引发的关注度不如 Libratus。

卡内基美隆大学模仿了 AlphaGo 的套路，赌场、机器与顶尖人类高手对决、20 万美元奖金，这显然比 DeepStack 团队一篇论文更能吸引目光。

（Source：PopularMechanics）

与此同时，一些扑克专家也对 DeepStack 提出质疑，认为与其对战的玩家中没有顶级选手，而 Libratus 要面对的却是全球排名在前的高手。

至于 20 万美元的奖金最终将被哪方收入囊中，我们还得等上差不多 3 周时间。

（本文由爱范儿授权转载；首图来源：Flickr/Morgan CC BY 2.0）

玩德州扑克的“AlphaGo”来了，击败它可以拿走 20 万美元

热门推荐

《还愿》回来了！有游戏还有童书，台湾限定实体版开放预购

《还愿》游戏从 Steam 下架！开发商赤烛：维护品质进行检测

《还愿》遭中国网友抵制、团队道歉、中国代理商终止合作，销量反冲高

我们的肉眼每秒能够捕捉多少画面？

最新内容

十年后全球锂电池产能高达 1.3TWh，亚太仍是生产重地

小脑其实并不小，研究：只有可丽饼厚，皱褶拉平长达 90 公分

全球最快！荣总团队 7 天就能找出新生儿听损原因

废弃火箭应已撞向月球，NASA 绕月飞行器预计 3 月中进行成像

聚焦电动车散热工程方案，高柏科技推出一条龙散热对策服务

金价触 2,000 美元大关，普丁盟友哈萨克原油也遭回避

303 停电惩处出炉，台电董事长杨伟甫准辞、王美花续留

真实版钢铁擂台！新北、鸿海合办世界级 FRC 机器人区域大赛

心诚镁结盟台耀、台新药！攻全球呼吸治疗药 CDMO 商机

高龄者打疫苗送 500 元内赠品！网传打三剂返台免隔离为假讯息

关于我们

新闻资讯

意见反馈

网站地图