用5款顶级游戏，测测人工智能拿几分？

来源：搜狐 2018-12-07 02:09:53 栏目：云计算 417 次编辑

全文共1145字，预计学习时长3分钟

如今，人工智能（AI）已经学会了不少游戏，甚至在一些游戏里打败了人类。游戏对于AI来说，是非常重要的。它为AI的开发和测试提供了一个相对受限但是安全的环境，因而也成为了测试AI程序的首选平台。

本文为大家介绍几款用于测试AI的几大顶级游戏，按出现时间从早到晚排列：

西洋双陆棋

1992年，IBM公司的杰拉尔德·特索罗（Gerald Tesauro）开发了一款名为TD-Gammon的游戏，这是一个计算机版本的西洋双陆棋。

这个计算机编程游戏采用了游戏专家都不曾了解的策略，并使用了名为“时序差分”（Temporal Difference , TD）的学习机制。控制它的算法包括了在神经网络中对每一步采取权重，可减小前一步的落子与下一步落子位置之间的差异。

国际象棋

1996年，IBM的深蓝电脑接连在国际象棋比赛中取胜。同年，它与世界象棋冠军卡斯帕罗夫进行了比赛，最终卡斯帕罗夫四胜两平局占优。1997年，深蓝再次向其发出挑战，卡斯帕罗夫最终落败。AI迈出了执行智能任务的第一步。

《危险边缘》

2011年，IBM再次推出了一款具备NLP（自然语言处理）功能的智能电脑，取名为Watson。

在《危险边缘》中，电脑对阵肯·詹宁斯和布拉德·鲁特。电脑需要强大的NLP才能理解游戏中不太直接的问题。最后电脑赢得了77,147美元，而詹宁斯和鲁特分别赢得了24,000美元21,600美元。

在《危险边缘》接受测试之后，Watson便在医疗保健，天气预报，网络安全等许多领域得到了广泛应用。

围棋

围棋是中国最古老也是最复杂的棋盘游戏。2016年，DeepMind公司的人工智能 AlphaGo和人类之间进行了一场围棋较量。五场比赛中，AlphaGo成功击败了世界冠军李世石。

在AlphaGo击败人类之前，由于涉及复杂的决策，围棋被认为是AI程序员面临的首要挑战之一。人工智能通过强化学习技术，多次自弈学习围棋。

DeepMind的创始人兼首席执行官丹米斯·哈撒比斯（Demis Hassabis）曾表示，在可用数据更少的情况下，AI也可以自行完成更多的学习，因此除了围棋，它也适合学习其他各种任务。它还可以帮助优化电网或简化航运路线，或改进科研工作。

扑克牌

2017年，来自卡内基梅隆大学的几名学生开发了一款名为Libratus的人工智能，可以与四名玩家在德州扑克中进行对战，并在为期20天的比赛中击败他们。

Libratus还击败了顶级扑克玩家如詹森·莱斯（Jason Les）、董·金（Dong Kim）、丹尼尔·麦克奥雷（Daniel McAulay）和吉米·周（Jimmy Chou）。

很明显，我们无法战胜这种近乎于纳什均衡（编者注：纳什均衡是指博弈中这样的局面，对于每个参与者来说，只要其他人不改变策略，他就无法改善自己的状况）的策略。在接下来的10天里，能够参加比赛并且全力以赴，我们就心满意足了。

詹森·莱斯在接受PokerListings采访时说道。他说，在比赛进行到一半时，他们就很清楚他们不会赢得比赛。大约一年后，一份研究论文揭示了Libratus是如何编程从而击败人类的。就像Alpha Go一样，它也学会了使用强化学习来学习如何玩游戏。

比赛之后，Libratus被用于政治谈判和拍卖。

THE END

二维码

下一篇>>

搜索内容