您现在的位置:首页 >> IT >> 正文
百度挑战世界级难题 智能围棋Bingo诞生
发表时间:2014年8月4日 16:01 来源:新科技 责任编辑:编 辑:麒麟

1997年,在IBM“深蓝”战胜国际象棋世界冠军卡斯帕罗夫之后,《时代》杂志提出了一项新的挑战:“让计算机与人类下围棋吧,它获胜的机会很小。计算机要在围棋上战胜人类,还要再过一百年,甚至更长的时间”。

如今,《时代》杂志的预言似乎要落空了。7月底在百度内部举行的“挑战Bingo”人机大战上,自然语言处理部开发的智能围棋系统—Bingo,在9路盘的最终决战中分别以两个2:1击退两名业余5段棋手的挑战,最终以14战全胜、总盘数37胜4负的绝对优势取得胜利,并且在19路盘上以较大优势击败业余初段。

“这是一个重要的进展”,百度副总裁王海峰表示,“得益于领先的人工智能算法与专家知识的完美结合。”

计算机博弈界一般把围棋分为9路、13路与19路三个子问题,目前都是尚未解决的问题。近来,日本程序Zen多次在9路盘上冲击职业棋手,但均以大比分连败告终。Bingo的这次胜利表明,其能力已达到世界顶级水平。

谈到技术上的创新,自然语言处理部工程师杨程说,“我们并不采用业界熟知的UCT算法,而是开发出了一种比UCT高效得多的算法,并成功地联合了蒙特卡洛搜索与Alpha-Beta搜索,这使得探索进一步偏向更具潜力的方向,Bingo也因此变得更加聪明。”

长期以来,计算机围棋是计算机科学领域公认的最具挑战性的研究课题之一。从本质上说,让计算机学会下围棋,近似于在无穷大的空间内进行搜索,并且对局面做出最优判断。自计算机逻辑和AI研究的奠基人阿兰·图灵提出著名的“图灵测试”以来,这个难题困扰了人类几十年,无数人曾为其呕心沥血—百度Bingo团队无疑朝着这个方向迈出了坚实的一步。

前中国棋院院长华以刚曾透露过一件鲜为人知的事情,微软创始人比尔·盖茨想进行围棋智能化研究,委托微软研究院和中国围棋协会,寻找数学方面和围棋方面的专家来研发,但因围棋过于深奥难解,最终微软研究院知难而退,这项研究计划胎死腹中。

不久前,Google研究院的Peter Norvig在接受《纽约客》杂志采访时表示,即使邀请大量专家,投入百倍硬件,设计出高明的软件架构,采用正确的机器学习算法,并结合神经科学领域的成就,我们也未必能够使计算机在围棋方面达到“深蓝”的成就。

为什么计算机更擅长国际象棋,而在围棋上遭遇到困难了呢?“深蓝”的方法可不可以移植到围棋上来?一般的共识是不可以,这涉及到两个问题。第一个是搜索空间。19路围棋的空间复杂度比国际象棋复杂10的120(+)次方倍,两者差距之大比整个太阳系相对单个原子核更庞大、更复杂!第二个,也是更严重的问题,即判别好坏的问题。没有人能够用计算语言说清楚棋盘上哪个地方是重点,一个子的好坏或许要到几十步以后才显现出来,甚至与盘上十几格以外的子有关(比如征子情况),而且吃子也不见得就一定是好事。

在早期的研究中,计算机科学家试图模仿人类的思维,搞模型识别,算死活,背定式等等,神经学家则试图让机器学习人脑,甚至对围棋高手的大脑进行扫描。由于没能真正搞清楚人类的思维过程,这些方法产生的最佳结果仍然处于很初级的阶段,以至于一般爱好者让它九子也没有问题。

近年来,随着UCT算法的出现,计算机围棋产生了突破性的进展。UCT是一种蒙特卡洛搜索算法,计算机在考虑某一步棋时,从这一步开始,随机模拟接下来数以万计的棋局变化,然后挑选出最有可能获胜的那一步棋。

然而,UCT仍然存在缺陷—“尤其当搜索空间充分大时,学习过程缓慢”,杨程介绍说,BlueFuego是采用UCT算法的著名系统,运行在IBM沃森研究中心的超级计算机蓝色基因上,但其在19路盘上仍达不到Bingo在8核机上的能力。

“我们开发出的这种学习算法,与UCT相比有着诸多优势:首先,新算法可以产生比UCT多若干倍的统计值,这加快了Bingo的在线学习速度。其次,算法定义了一种弱化形式的Alpha-Beta搜索,将其与在线强化学习和离线监督学习结合起来,并成功地嵌入到蒙特卡洛搜索当中,这使得探索更加深入地往极具前景的方向发展。”

[1]  [2]  
关于我们 | 联系我们 | 友情链接
新科技网络【京ICP备14006744号】
Copyright © 2014 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。