最乐观的估计 10年后 围棋软件才可能与弱九段抗衡
百度挑战世界级难题 智能围棋Bingo诞生
1997年,在IBM“深蓝”战胜国际象棋世界冠军卡斯帕罗夫之后,《时代》杂志提出了一项新的挑战:“让计算机与人类下围棋吧,它获胜的机会很小。计算机要在围棋上战胜人类,还要再过一百年,甚至更长的时间”。
如今,《时代》杂志的预言似乎要落空了。7月底在百度内部举行的“挑战Bingo”人机大战上,自然语言处理部开发的智能围棋系统—Bingo,在9路盘的最终决战中分别以两个2:1击退两名业余5段棋手的挑战,最终以14战全胜、总盘数37胜4负的绝对优势取得胜利,并且在19路盘上以较大优势击败业余初段。
“这是一个重要的进展”,百度副总裁王海峰表示,“得益于领先的人工智能算法与专家知识的完美结合。”
计算机博弈界一般把围棋分为9路、13路与19路三个子问题,目前都是尚未解决的问题。近来,日本程序Zen多次在9路盘上冲击职业棋手,但均以大比分连败告终。Bingo的这次胜利表明,其能力已达到世界顶级水平。
谈到技术上的创新,自然语言处理部工程师杨程说,“我们并不采用业界熟知的UCT算法,而是开发出了一种比UCT高效得多的算法,并成功地联合了蒙特卡洛搜索与Alpha-Beta搜索,这使得探索进一步偏向更具潜力的方向,Bingo也因此变得更加聪明。”
长期以来,计算机围棋是计算机科学领域公认的最具挑战性的研究课题之一。从本质上说,让计算机学会下围棋,近似于在无穷大的空间内进行搜索,并且对局面做出最优判断。自计算机逻辑和AI研究的奠基人阿兰·图灵提出著名的“图灵测试”以来,这个难题困扰了人类几十年,无数人曾为其呕心沥血—百度Bingo团队无疑朝着这个方向迈出了坚实的一步。
前中国棋院院长华以刚曾透露过一件鲜为人知的事情,微软创始人比尔·盖茨想进行围棋智能化研究,委托微软研究院和中国围棋协会,寻找数学方面和围棋方面的专家来研发,但因围棋过于深奥难解,最终微软研究院知难而退,这项研究计划胎死腹中。
不久前,Google研究院的Peter Norvig在接受《纽约客》杂志采访时表示,即使邀请大量专家,投入百倍硬件,设计出高明的软件架构,采用正确的机器学习算法,并结合神经科学领域的成就,我们也未必能够使计算机在围棋方面达到“深蓝”的成就。
为什么计算机更擅长国际象棋,而在围棋上遭遇到困难了呢?“深蓝”的方法可不可以移植到围棋上来?一般的共识是不可以,这涉及到两个问题。第一个是搜索空间。19路围棋的空间复杂度比国际象棋复杂10的120(+)次方倍,两者差距之大比整个太阳系相对单个原子核更庞大、更复杂!第二个,也是更严重的问题,即判别好坏的问题。没有人能够用计算语言说清楚棋盘上哪个地方是重点,一个子的好坏或许要到几十步以后才显现出来,甚至与盘上十几格以外的子有关(比如征子情况),而且吃子也不见得就一定是好事。
在早期的研究中,计算机科学家试图模仿人类的思维,搞模型识别,算死活,背定式等等,神经学家则试图让机器学习人脑,甚至对围棋高手的大脑进行扫描。由于没能真正搞清楚人类的思维过程,这些方法产生的最佳结果仍然处于很初级的阶段,以至于一般爱好者让它九子也没有问题。
近年来,随着UCT算法的出现,计算机围棋产生了突破性的进展。UCT是一种蒙特卡洛搜索算法,计算机在考虑某一步棋时,从这一步开始,随机模拟接下来数以万计的棋局变化,然后挑选出最有可能获胜的那一步棋。
然而,UCT仍然存在缺陷—“尤其当搜索空间充分大时,学习过程缓慢”,杨程介绍说,BlueFuego是采用UCT算法的著名系统,运行在IBM沃森研究中心的超级计算机蓝色基因上,但其在19路盘上仍达不到Bingo在8核机上的能力。
“我们开发出的这种学习算法,与UCT相比有着诸多优势:首先,新算法可以产生比UCT多若干倍的统计值,这加快了Bingo的在线学习速度。其次,算法定义了一种弱化形式的Alpha-Beta搜索,将其与在线强化学习和离线监督学习结合起来,并成功地嵌入到蒙特卡洛搜索当中,这使得探索更加深入地往极具前景的方向发展。”
Bingo所蕴含的领先技术不但在围棋上取得了成功,也已推广和应用到百度其它产品。主任架构师田浩介绍说,“Bingo研发过程中产生的多种创新思想与技术,已融入到包括百度网页搜索在内的多个产品的在线学习策略中,并取得了非常明显的效果。”
谈到未来,王海峰说,“Bingo初出茅庐便大获全胜,非常令人振奋。有了这次大规模实战,相信Bingo可以迅速总结、学习、提升,变得更加强大。我们终将证明,在围棋这样的高级智力活动中,计算机也可以超越人类。”
当前围棋软件水平最高的,如银星,主要采用蒙托卡罗算法,职业九段可以让其四子;采用人工神经网络算法的水平还要低一些,但发展前景看好。有人说10年内围棋软件挑战职业高手无望。
当软件可以赢九段高手的话,就是围棋开始没落的时候。中国象棋就是这样。
最重要的,是围棋极少和棋,胜负之间极微妙。如果围棋象现在中国象棋那样,百分百和棋,那它也就开始沒落了。
九段让四子已经是业余5段水平了,说明围棋软件取得了质的进步。
达到业余5段必须对围棋一些虚的部分有较好的认识才可能,或者计算能力很强。