如何看待人工智能攻破德州扑克
如何看待人工智能攻破德州扑克?
◀◀◀点击图片进入游戏————◀◀◀◀———点击图片进入游戏———桥牌游戏,真钱扑克游戏,现金棋牌游戏
我自己很喜欢打德州扑克,经常参加德州扑克比赛。
在牌桌上,自我感觉是一名稳健型牌手,保持了还算不错的胜率。
围棋是一项讲究计算和形势判断能力的游戏。
而德州扑克就与此不同,它讲究的是在多人博弈中,避免人性贪婪、恋战等弱点,并将科学的概率统计与灵活的实战策略很好地配合起来。
人工智能已经在围棋领域取得历史性的突破,那么,在德州扑克的世界里,人工智能的表现又如何呢?
如前所述,在围棋、象棋等游戏中,人工智能可以和人类选手一样,在每一步决策前获得棋盘上的全部信息。
这种限定规则,随时可以获取全部信息的游戏,我们可以称之为「完整信息的博弈游戏」。
而在《星际争霸》或德州扑克中,人工智能和人类选手通常无法在特定时刻获得有关游戏的全部信息,比如,在德州扑克中,你无法知道对手的底牌是什么,你也不知道发牌员发出的下一张牌是什么,在这类「不完整信息的博弈游戏」里,人工智能必须像人一样,根据经验或概率统计知识,猜测对手底牌和下一张牌的可能性,然后再制定自己的应对策略。
显然,对于实现人工智能算法而言,不完整信息的博弈游戏在技术难度上要大得多。
就在哈萨比斯的团队借助《星际争霸》磨炼下一代人工智能算法的同时,卡内基-梅隆大学的研究者选择了德州扑克作为他们攻克此类问题的出发点。
来自卡内基-梅隆大学的托马斯·桑德霍姆(Tuomas Sandholm)教授与他的博士生诺姆·布朗(Noam Brown)最早开发了一款名为 Claudico 的德州扑克程序。
Claudico 是一个拉丁文单词,对应于德州扑克中的一种特别的策略——平跟(limping),指的是翻牌之前,选择跟大盲注而不加注的策略。
平跟这种策略,在人类德州扑克比赛中,使用的频率并不是很高,但据托马斯·桑德霍姆介绍,计算机通过学习发现,使用这种策略有许多好处。
值得注意的是,托马斯·桑德霍姆的团队在研发德州扑克程序时,主要不是向人类职业选手学习打牌技巧,而是让计算机通过自我训练,自己寻找最好的方法。
如何看待人工智能攻破德州扑克?
Comments
Post a Comment