http://www.chlablak.com

                                                                  【澳客时时彩注册】第三代AI赌神:在六人桌德扑中胜过5个人类顶尖高手

                                                                  第三代AI赌神:在六人桌德扑中胜过5个人类顶尖高手

                                                                  第50届世界扑克系列赛(WSOP)的六人桌无限德扑即将在7月13日开赛,但AI偏偏选在这个节骨眼上踢馆。

                                                                  美国卡内基梅隆大学和Facebook公司7月12日在《科学》上发表论文称,他们联合开发的德扑人工智能Pluribus能在六人桌无限德扑中击败顶级人类玩家。

                                                                  这些顶级高手包括拥有职业冠军头衔最多的达尔文·埃利亚斯(Darren Elias)、6次世界扑克系列赛冠军得主“耶稣&r)dquo;克里斯·弗格森(Chris Ferguson)和在职业生涯中赚了将近200万美元的麦克·加利亚诺(Michael "Gags" Gagliano)。

                                                                  无论是一个Pluribus对战5个顶级人类玩家,还是五个Pluribus混战一个顶级人类玩家,经过1万手牌后,它的表现都会明显优于人类。

                                                                  “Pluribus”是一个拉丁语词汇,意为“众”,美国国徽上就印有“E pluribus unum”(合众为一)的字样。起这个名字,无疑彰显这是世界上首个在多人德扑中超越人类专业选手的AI。

                                                                  在过去的20年里,我们见证了西洋双陆棋、跳棋、国际象棋和围棋等游戏在人工智能面前纷纷沦陷。人机大战往往成为AI发展史上的里程碑事件,例如卡斯帕罗夫与“深蓝”、李世石与“阿尔法狗”的巅峰对弈。不过,这些事件无一例外局限于机器和一人对决,而扑克在传统上是个多人游戏。

                                                                  从两人到多人,不仅只是量变,还对人工智能增加了许多根本性的挑战。Pluribus通过“行动抽象”和“信息抽象”等方式来解决这些挑战。在与5个“自己”博弈的过程中,Pluribus学会了六人局无限注德扑的玩法。

                                                                  埃利亚斯的感受是,德扑AI最大的优势在于混合运用多种策略,这也是人类高手想要达到的境界。然而,绝大数人都无法持续性地随机调整策略。

                                                                  Pluribus也验证了一些牌桌上广为流传的智慧。例如“平跟”(limping)这种在翻牌之前,选择跟平大盲注而不加注的策略对绝大多数玩家而言都是欠佳的选择,只有“小盲注”玩家除外,因其已经在池中下了等同于一半大盲注的筹码。

                                                                  初出茅庐的“平跟”

                                                                  美国卡内基梅隆大学计算机系教授托马斯&mid(dot;桑德霍姆(TuomasSandholm)已经钻研德扑程序16年。为了缔造AI赌神,他带着博士生诺姆·布朗(Noam Brown)先从1V1无限注德扑做起。他们开发的第一款德扑程序名为Claudico,在拉丁语中对应着“平跟”。

                                                                  2015年4月到5月,Claudico在匹兹堡的河流赌场轮流与包括当时世界排名第一的道格·波尔克(Doug Polk)在内的四名人类顶尖高手过招。那次比赛历时13天,共计2万局牌。为降低运气成分,比赛使用的是镜[像牌局的玩法,即在不同房间的两张牌桌上使用完全相同、但人机对调的两副牌。

                                                                  郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

                                                                  上一篇:bootstrap4如何设置按钮-Bootstrap教程
                                                                  下一篇:没有了