用5款顶级游戏,测测人工智能拿几分?

全文共1145字,预计学习时长3分钟

如今,人工智能(AI)已经学会了不少游戏,甚至在一些游戏里打败了人类。游戏对于AI来说,是非常重要的。它为AI的开发和测试提供了一个相对受限但是安全的环境,因而也成为了测试AI程序的首选平台。

本文为大家介绍几款用于测试AI的几大顶级游戏,按出现时间从早到晚排列:

西洋双陆棋 

1992年,IBM公司的杰拉尔德·特索罗(Gerald Tesauro)开发了一款名为TD-Gammon的游戏,这是一个计算机版本的西洋双陆棋。

这个计算机编程游戏采用了游戏专家都不曾了解的策略,并使用了名为“时序差分”(Temporal Difference , TD)的学习机制。控制它的算法包括了在神经网络中对每一步采取权重,可减小前一步的落子与下一步落子位置之间的差异。

国际象棋 

1996年,IBM的深蓝电脑接连在国际象棋比赛中取胜。同年,它与世界象棋冠军卡斯帕罗夫进行了比赛,最终卡斯帕罗夫四胜两平局占优。1997年,深蓝再次向其发出挑战,卡斯帕罗夫最终落败。AI迈出了执行智能任务的第一步。

《危险边缘》 

2011年,IBM再次推出了一款具备NLP(自然语言处理)功能的智能电脑,取名为Watson。

在《危险边缘》中,电脑对阵肯·詹宁斯和布拉德·鲁特。电脑需要强大的NLP才能理解游戏中不太直接的问题。最后电脑赢得了77,147美元,而詹宁斯和鲁特分别赢得了24,000美元21,600美元。

在《危险边缘》接受测试之后,Watson便在医疗保健,天气预报,网络安全等许多领域得到了广泛应用。

围棋 

围棋是中国最古老也是最复杂的棋盘游戏。2016年,DeepMind公司的人工智能 AlphaGo和人类之间进行了一场围棋较量。五场比赛中,AlphaGo成功击败了世界冠军李世石。

在AlphaGo击败人类之前,由于涉及复杂的决策,围棋被认为是AI程序员面临的首要挑战之一。人工智能通过强化学习技术,多次自弈学习围棋。

DeepMind的创始人兼首席执行官丹米斯·哈撒比斯(Demis Hassabis)曾表示,在可用数据更少的情况下,AI也可以自行完成更多的学习,因此除了围棋,它也适合学习其他各种任务。它还可以帮助优化电网或简化航运路线,或改进科研工作。

扑克牌 

2017年,来自卡内基梅隆大学的几名学生开发了一款名为Libratus的人工智能,可以与四名玩家在德州扑克中进行对战,并在为期20天的比赛中击败他们。 

Libratus还击败了顶级扑克玩家如詹森·莱斯(Jason Les)、董·金(Dong Kim)、丹尼尔·麦克奥雷(Daniel McAulay)和吉米·周(Jimmy Chou)。 

很明显,我们无法战胜这种近乎于纳什均衡(编者注:纳什均衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况)的策略。在接下来的10天里,能够参加比赛并且全力以赴,我们就心满意足了。 

詹森·莱斯在接受PokerListings采访时说道。他说,在比赛进行到一半时,他们就很清楚他们不会赢得比赛。大约一年后,一份研究论文揭示了Libratus是如何编程从而击败人类的。就像Alpha Go一样,它也学会了使用强化学习来学习如何玩游戏。

比赛之后,Libratus被用于政治谈判和拍卖。

THE END
分享
二维码
< <上一篇

下一篇>>