1月11日,一场无限投注德州扑克比赛在美国匹兹堡开打。参赛者一边是4位德扑牌手,一边是人工智能扑克程序“Libratus”,比赛为期20天,将在1月30日结束。目前比赛进程刚刚过半,有意思的是,这场人机大战战况跌宕起伏,人类与AI交替领先,剧情经历了反转之后的再反转。
最初几天Libratus占尽上风。比赛第一天Libratus就赢下8.2万美金;两天过后,Libratus赢下的筹码达到15万美金;第三天,Libratus的优势继续扩大,达到19.3万美金。阿尔法狗在围棋界“统治”了人类,而Libratus似乎正在向阿尔法狗看齐,要在德扑界大杀特杀。
不过,没过几天剧情就发生反转,几位德扑牌手开始向AI发起反攻。第四个比赛日,Libratus的领先优势下滑,手上的筹码减至15.1万美元。而第六个比赛日结束后,Libratus手上只有5.1万美元了。Jason Les,与Libratus对战的其中一位牌手,在一封邮件里说到:“我们开局糟糕,但这是比赛之前就预料到的。比赛一开始时我们还摸不清这位对手的套路,我们在搞清这一点上花了些时间。”当时有媒体称,创造性和调整能力是人类胜过AI的地方。
然而到了1月11日,第十个比赛日,剧情再次反转,Libratus重新追回了领先优势,而且把和人类的差距拉得更大了。目前Libratus已经赢得了67.7万美元,而四位牌手每人手上的筹码都不到10万美元。
怎么会这样?简单说来,Libratus会从比赛中学习。
Libratus的研发者是卡内基美隆大学的Tuomas Sandholm和Noam Brown。Sandholm表示:“比赛结束之前我们还不能透露Libratus的技术细节,但我可以这样讲,Libratus程序可是在超级计算机上无休无止地运行,超级计算机的策略每天都在改进。”
Tuomas Sandholm和Noam Brown之前研发过一款德扑机器人Claudico,在2015年挑战人类失败。但他们最新的研究成果Libratus显然比Claudico强了不止一个档次。Jason Les就是2015年与Claudico交手的牌手之一,他也认为Libratus要比Claudico强。“Libratus能轻松击败Claudico无压力。”Les说到。
虽然目前人工智能还没能在多人无限投注德扑比赛中赢过人类,但看起来这种情况维持不了太久了。
声明:本文为懒熊体育综合编译自Business Insider,原文作者为Gus Lubin