刚颠覆了围棋人工智能又要攻陷德州扑克区域

偏方秘方 2020年05月12日浏览：5 次

刚颠覆了围棋，人工智能又要攻陷德州扑克

谷歌旗下DeepMind研发的阿尔法狗(AlphaGo)刚以Master的名义战胜了当今围棋第一人柯洁，宣告人工智能针对人类的又一轮胜利，引起轩然大波。紧接着，人工智能在扑克游戏中的捷报似乎又已经发出。

据澎湃报道，来自加拿大和捷克的10位科学家近日在预印本站arXiv上载了一篇题为《DeepStack：无限注德扑的专业级人工智能玩家》的论文，介绍了一种能在一对一无限注德州扑克中击败人类玩家的新算法DeepStack。

在过去的20年里，我们见证了许多游戏领域在人工智能面前纷纷沦陷，比如深蓝攻陷象棋，阿尔法狗60次击败各路围棋选手，而在扑克领域，2008年，来自阿尔伯塔大学的团队也曾对人类挑战成功，不过是在有限制德扑对阵上。

而之所以在扑克类游戏中，人工智能的进展不大，主要是扑克类游戏的不确定性。而围棋等棋类游戏是完美信息游戏，也就是说，所有玩家在游戏中能获得的确定性信息是对称的。

在棋类游戏的对阵中，人工智能可以凭借自己的计算优势，看到所有棋盘上的棋子，人类玩家的每一步落棋，都能被人工智能计算出所有的可能性。

但是，人类生活中还要面临更多非完美信息的情景，正如计算机之父冯诺依曼所说，

现实世界与此不同，现实世界包含有很多赌注、一些欺骗的战术，还涉及你会思考别人会认为你将做什么。

德州扑克就是这样一种包含了欺骗、推测的非完美信息游戏，人工智能并不知道发牌员发出的下一张牌是什么，也不知道对手握的什么牌，只能掌握自己手上的牌，通过这种非对称的信息与对手进行博弈。

因此，虽然一对一无限注德扑游戏中包含10的160次方个决策点，要少于围棋，但它对人工智能的推理能力提出了更高的要求。在创新工场《人工智能战略展望会》上，李开复表示，我们任何的工作如果说不经过，超过五秒钟的思考，都是做不过机器的。

而当人工智能被培养出了类似人的直觉，如今这项有时需要经过50秒思考的游戏，或许也将在人工智能面前失守。

加拿大和捷克的合作团队开发出了新算法DeepStack。在运用深度学习，反复自我博弈之后，DeepStack学会了在每一个具体情境出现时进行推理。这非常接近人类玩家的牌感，即在当前情境下对个人牌面大小的感觉，并作出相应的决策。

而通过这种直觉，DeepStack已经取得了超出人类数十倍的成绩。该团队邀请了来自17个国家的33名专业扑克选手挑战DeepStack，在2016年11月7日到12月12日之间共进行了44852次较量。DeepStack成为了首个在一对一无限注德扑中战胜人类玩家的人工智能，并且平均胜率达到了492mbb/g(milli-big-blinds per game，一般职业玩家认为50mbb/g是个门槛)。

不过暂时不用担心的是，DeepStack目前的成绩仅限于一对一无限制级对阵中，多人参与的德州扑克，人工智能还是有心无力的。

声明：本文仅为传递更多络信息，不代表ITBear观点和意见，仅供参考了解，更不能作为投资使用依据。

活血祛瘀的食物有哪些
武汉治疗白斑病费用
白带多常见根本原因是什么