人机博弈续:国、中、围三棋人机巅峰战

人机博弈续:国、中、围三棋人机巅峰战

人机博弈续:国、中、围三棋人机巅峰战 1%title%

一:前言

本文虽然被归在了《集异璧之大成阅读笔记及杂谈附录》系列里面,但是这篇文章的性质和前面会有很大差别。其并非是关于科普、研究或者类似这方面的主题。本质上,这篇文章可以被视为是对一段“历史”的简略回顾。虽然这三段历史早就已经被人们大书特书很多次了……

在《人机博弈》一文中,曾经简略的讲述了一下人机对抗历史中,计算机技术发展的大致脉络。其中也提到了算法等相关方面非常粗浅的带有个人偏见的一些介绍。不过本文的目光将会更加聚焦在“人类”这一侧的视角。通过三门最具代表性的“智力游戏”,棋类游戏中的三座高峰:国际象棋、中国象棋和围棋。这三大棋类游戏中,人类与计算机共发生了三次巅峰对战——当时最先进的计算机对抗当时的人类第一棋手。

整个历程的回顾将会按照时间顺序——从最早国际象棋领域,在96年至97年,当时的人类第一卡斯帕罗夫与当时IBM最强大的超级计算机“深蓝”对战;06年,中国象棋数位特级大师对阵当时中国的超级计算机“浪潮天梭”;一直到最具冲击的17年,人类与计算机最巅峰的智力对抗:中国乌镇围棋峰会,当时的人类第一柯洁对阵最新的神经网络计算机“Alpha·master”。

棋道一词,在某种角度与“竞技精神”似乎是互相冲突的,尤其在今天这个社会。人们对于“竞技精神”的理解,似乎都已经局限在了唯结果论上。也许是因为这样的讨论简单、直接、痛快。但也许即使是那些“唯结果论”的人们自己都很清楚,事实未必如此。过于简单化的讨论问题,是因为大多数人或是未知,或是一知半解。但确实大部分人对于这个问题的讨论仅仅到此为止,毕竟棋类在今天这一代人来说,已经变得相对小众了。而这个探索过程并不符合直观利益——需要耗费大量的时间和精力去了解,而且并不会产生直接的效益。所以关于这一问题的讨论往往两极分化:唯结果论是其中的一头,而另一头则是过度的“人文关怀”。当输棋的那一刻:“AI必然灭亡人类”、“终结者的预言实现了”、“这是人类悲壮的赞歌”、“人类不过是蝼蚁”、“围棋的艺术已经被AI杀死”……诸如此类。

人机博弈续:国、中、围三棋人机巅峰战 2%title%

并非如此,不论是对于人工智能领域有深入研究的专家,或者是棋类的职业选手,他们对于这个问题的理解往往和上述看到的“流行观点”不同。至少在他们看来,这个问题尚未得出结论。没错,人类确实输棋了,在计算方面人脑确实不及电脑。但是AI已经有自我意识了吗?棋类游戏已经走到消亡的边境了吗?好像不是,恰恰相反,三棋赢来后AI时代之后,反而使得人类的棋道竞技水平获得了极大的提高。另一方面,计算机也没有因为赢棋而站到人类的对立面,恰恰相反,它们成为了今天棋类职业选手的辅助工具。

当然这其中还有相当多维度的问题值得讨论:如今很多棋软甚至都开源了,而对于计算机下棋的理解是具有门槛的。很多人只能依据计算机的局面判断打分,而片面地判断下结论。更甚者,就是利用计算机来做弊了。这可能是未来AI最有可能面对的大问题——AI的滥用,并且这种滥用很可能是建立在对其完全无知的基础上的。

当然,笔者确实有写态度,但并没有结论。本文的目的也更多在于叙述,而非探讨和结论。偏颇之处是必然的事情。并且由于篇幅有限,各种细节可能也会有大量的缺失和遗漏。届时希望各位了解的更专业的朋友可以在评论区给予指正,这里先提前表示感谢了。

那么接下来,我们就进入正题吧……

人机博弈续:国、中、围三棋人机巅峰战 3%title%

二:1997年,卡斯帕罗夫VS深蓝——王者之争

有关于国际象棋,在机核已经有了非常详实的介绍文章。这里为大家介绍机核作者:猫毛卯茂老师。如果有朋友对于国际象棋完全不了解的,并且有兴趣的话,笔者在这里推荐猫毛卯茂老师的系列文章:

《黑方格、白方格:国际象棋基本知识与操作》

《看得见摸得着的技术:介绍国际象棋设备中的小发明》

《棋手的起手,国际象棋的开局》

《聊聊职业国际象棋水平是怎么衡量的》

《介绍一些国际象棋子力的常用战术》

《简单介绍一下国际象棋兵线的控制》

《国际象棋的“花样”,从棋子的设计风格出发,介绍棋子形象的来历》

《推荐一些通过网络自学国际象棋的方式》

《介绍一些你可能用不到的国际象棋规则》

《简单介绍一下国际象棋世界冠军锦标赛的选拔机制》

《终局之战:国际象棋残局优势下常用的攻王套路》

有关于国际象棋的人机大战内容,其实在GEB读书笔记系列里已经用了一部分篇幅提到了。编写可以和人类下棋的电脑程序一直是人工智能领域里面的一个重要课题,很多科学家对此心向往之。回顾历史,由于早期计算机刚刚发展起来的阶段,人们获得了大量的进展和成果:如1951年,西洋跳棋程序和国际象棋程序就相继诞生了。计算机科学家亚瑟·山谬尔(Arthur·Samuel)在五十年代中期和六十年代初开发的西洋跳棋的棋力已经可以挑战具有相当水平的业余爱好者。(他被誉为“机器学习之父”山谬尔开发的下棋程序具有多次对弈进步的能力,他所开发的程序在经历多次对局之后,已经可以战胜他这个开发者了)这些成果使得第一代人工智能的研究者们太过于乐观,他们当时提出了很多过分乐观的展望——比如1958年,艾伦·纽厄尔和赫伯特·西蒙就放言:“十年之内,数字计算机将成为国际象棋世界冠军。”但考虑到当时认知的局限性,使得研究者们并没有找到正确的进步方向。

在50年代和60年代,人们认为让机器下一手好棋的关键,是使它在可能的着法序列构成的分支网络上,比任何棋术大师所能超前搜索的步数都多。可是,当这一目标逐渐达到后,计算机的棋艺并没有突飞猛进,超过人类高手的水平。事实证明,仅仅依赖于超前搜索的计算机下棋程序还没有被教会在一个更高的层次上思考,它的战略只是凭着一股蛮劲进行超前搜索,企图压倒各种类型的对手。但这种办法并不灵,一直到GEB书出版的时候,国际象棋AI的水平只能和普通业余水平的高手较量,在职业领域里败多胜少。

棋盘是人机大战最早开始的战场,而一直到1997年深蓝对决卡斯帕罗夫,计算机才第一次在棋盘上击败人类最高水平。整场对决持续了一年,卡斯帕罗夫和“深蓝”分别在1996年和1997年进行了对决。96年以卡斯帕罗夫4比2战胜了“深蓝”,之后IBM对“深蓝”进行了升级,计算能力达到了之前的两倍。(代号也变为“更深的蓝”)在97年对决卡斯帕罗夫的时候以3.5比2.5终于战胜卡斯帕罗夫。

虽然这场对决,后世尚有争议(卡斯帕罗夫质疑IBM作弊)。但是本文的重点,依然放在了对局本身上。那么在开始欣赏对局之前,我们先来看一看人机两方的选手……

人机博弈续:国、中、围三棋人机巅峰战 4%title%

2·1:世界棋王卡斯帕罗夫

加里·卡斯帕罗夫,全名加里·基莫维奇·卡斯帕罗夫(Гарри·Кимович·Каспаров),1963年4月13日出生于阿塞拜疆首都巴库,前苏联、俄罗斯职业国际象棋棋手,国际象棋特级大师。 卡斯帕罗夫能讲15国语言,还是一位数学家、计算机专家和纽约《华尔街》杂志的定期撰稿人。

卡斯帕罗夫从6岁开始学习下国际象棋,9岁便成为了一级棋手,12岁晋升为候补大师,13岁获得全苏青年赛冠军,15岁晋升国际大师,16岁获世界青年赛冠军。

1980年,17岁的卡斯帕罗夫晋升国际象棋特级大师(Grandmaster)。同年获得世界青少年组冠军赛冠军。随后他又在一系列的国际大赛里频频夺冠。卡斯帕罗夫棋风凶悍活泼,胆略过人,思维非理性,有异常敏锐的感知判断力,能通过一些战术性的接触出人意料地改变棋局的自然进程,甚至经常采取大胆弃子、疾进反击的策略去赢得比赛。由于卡斯帕罗夫棋风犀利,进攻性强,在赛场上也常常表现得咄咄逼人,人送外号“巴库的野兽”。

1981年,卡斯帕罗夫并列夺得苏联国际象棋全国赛冠军。同年在莫斯科为庆祝苏联共产党第26次代表大会而举行的苏联4队团体对抗赛上,新老世界冠军卡尔波夫、斯梅斯洛夫以及罗曼尼申、卡斯帕罗夫两位特级大师分任国家一队、老年队、国家二队和青年队的主将。经过双循环赛,结果卡斯帕罗夫6局得4分,获得最高胜率。同年在格拉茨世界青年团体冠军赛上,卡斯帕罗夫以一号主力身份,接连奋战10轮,帮助苏联队夺冠。

1983年卡斯帕罗夫在国际象棋世界冠军候选人赛中先后战胜别利亚夫斯基、科尔奇诺依,1984年在世界冠军候选人决赛中战胜斯梅斯洛夫,获得了向阿那托里·卡尔波夫挑战世界冠军的资格。1984年9月9日国际象棋世界冠军赛在莫斯科正式举行。比赛规定先胜六局者为胜,和棋不计分。比赛经过长达135天的角逐,在第48局时,卡斯帕罗夫已经从0比5追成了3比5。就在比赛即将见分晓时,当时的国际棋联主席、苏联人坎博马内斯中止了比赛,并宣布择期重新举行对抗赛。由于比赛被中止,卡尔波夫继续保留世界冠军称号。

1985年9月2日,第二次“两卡之战”在莫斯科继续进行。对抗赛恢复了24局制,先得12.5分者为胜。11月9日,卡斯帕罗夫最终以13比11胜出,成为了国际象棋史上的第13位世界冠军。22岁的他也是历史上最年轻的一位世界棋王。

人机博弈续:国、中、围三棋人机巅峰战 5%title%

1986年8月至10月,第三次“两卡之战”在英国伦敦和俄罗斯列宁格勒(即圣彼得堡)举办。这次对抗赛是卡尔波夫发起的“回敬赛”。比赛仍为24局制,先得12.5分者为胜。最终卡斯帕罗夫以12.5比11.5卫冕成功。 11月,在阿联酋迪拜举行的第27届国际象棋奥林匹克团体赛中,卡斯帕罗夫坐镇苏联队第一台,以出战11场获8.5分的成绩,获得个人台次金牌,帮助苏联队夺冠,同时为来自全球108个国家的棋手作了一次成功的表演。

1987年,卡尔波夫再次获得了向卡斯帕罗夫发起挑战的资格。10月,第四次“两卡之战”在西班牙塞维利亚打响。经过24局的激烈对抗,卡斯帕罗夫在前23局11比12落后的不利形势下,在最后一局获胜成功扳平比分,并凭借“打平即卫冕成功”的规则,幸运地保住了世界冠军头衔。

卡斯帕罗夫于1987年成立了国际特级大师协会,并创办了1988年至1989年的首届世界杯国际象棋个人系列冠军赛。在该赛事中,卡斯帕罗夫再度超越卡尔波夫等棋手,成为“双料”世界冠军。

1989年,卡尔波夫又一次杀入世界冠军赛决赛。1990年10月至11月间,第五次“两卡之战”在美国纽约和法国里昂打响。比赛仍为24局,先得12.5分者胜出。卡斯帕罗夫最终以12.5比11.5再度胜出,成功卫冕。

1992年6月,在菲律宾马尼拉举行的第30届国际象棋奥林匹克团体赛中,俄罗斯在14场满分56分中积39分,卡斯帕罗夫坐镇俄罗斯一号台,保持不败纪录,得8.5分并获得个人台次金牌,帮助俄罗斯队成功卫冕。同月在格鲁吉亚首都第比利斯举办的共有40个国家参加的欧洲国际象棋团体冠军赛中,卡斯帕罗夫出场8次,取得6分,帮助俄罗斯队以总积分领先亚军3分的优势捧得冠军奖杯。11月10日在巴黎举行的“伊姆布阿杯”世界快棋大奖赛中,卡斯帕罗夫以1.5比0.5战胜克拉姆尼克,以2比0击败波鲁加也夫斯基,半决赛2比0淘汰卡姆斯基,决赛与阿南德前两局打平,在超快棋加赛中,最终取得胜利,赢得该赛事冠军。

1993年,由于对世界国际象棋联合会(国际棋联)的诸多做法感到不满,卡斯帕罗夫宣布退出国际棋联,并成立了世界职业国际象棋联盟,先后三次单独组织世界棋王争霸战,与国际棋联分庭抗礼。在1993年和1995年的两次职业国际棋协世界冠军对抗赛中,卡斯帕罗夫先后击败了肖特和阿南德,成功地夺冠和卫冕。

在接下来各类国际比赛中,卡斯帕罗夫又接连在超级大赛中获得了11个冠军,代表原苏联和俄罗斯先后7次获得国际象棋奥林匹克团体赛冠军,11次荣膺国际象棋选手的最高荣誉“奥斯卡奖”。

1996年2月10日至17日,卡斯帕罗夫与IBM公司的国际象棋电脑“深蓝”(DeepBlue)计算机对弈,在6局比赛中,卡斯帕罗夫以4比2战胜计算机“深蓝”,获得40万美元高额奖金。 同年12月8日至22日,在西班牙拉斯帕尔马斯举办的世界等级分前6名参加的超级大赛(等级高达19级)中,卡斯帕罗夫以3胜7和积6.5分的战绩,夺得冠军。

人机博弈续:国、中、围三棋人机巅峰战 6%title%

1997年5月11日,卡斯帕罗夫与“深蓝”再次交锋,最终以2.5比3.5(1胜2负3和)输给了“深蓝”。 6月,在诺夫格罗德国际联赛上,卡斯帕罗夫与另5位世界顶尖高手进行双循环10轮比赛,卡斯帕罗夫以领先亚军1.5分的优势再次夺取冠军奖杯。

1999年卡斯帕罗夫获得超级-17的维克安泽、超级-16的利纳雷斯和超级-12的萨拉热窝大赛冠军。2000年,卡斯帕罗夫的积分一度达到2851,这一分数是国际象棋比赛有史以来的最高分。 同年,MSN主办了一场由卡斯帕罗夫一人对抗来自全世界75个国家、超过5万名爱好者的网络对抗比赛。经过四个月的拉锯战,世界队投票弃权,卡斯帕罗夫获胜。

2000年11月3日,卡斯帕罗夫在世界象棋锦标赛第15盘的比赛中与挑战者克拉姆尼克战和,以总比分6.5比8.5不敌对手,失去保持了15年的世界冠军头衔。

2003年2月,卡斯帕罗夫与新的超级计算机“深蓝二代”(“DeepJunior”)进行对决,最终双方战平(1胜1负4和);同年11月,卡斯帕罗夫又与另一台超级计算机“计算机棋手”(X3D-FRITZ)对局,双方再度战平(1胜1负2和)。

卡斯帕罗夫在20多年的职业生涯中,在1985年至2006年间连续23次世界排名第一。2005年3月11日在第九次夺得利纳雷斯国际象棋超级大赛冠军后,他宣布退役。可以说卡斯帕罗夫是人类国际象棋史上的奇才,被誉为“棋坛巨无霸”。

人机博弈续:国、中、围三棋人机巅峰战 7%title%

2·2:深蓝超级计算机

超级计算机“深蓝”的研发,最早起始于美国宾夕法尼亚州匹兹堡的卡内基梅隆私立大学。最早在1985年,大学内将这个研发工作以“芯片测试”(ChipTest)的名字立项。该项目旨在设计出一个可以和人类在国际象棋上对弈的程序。这个研发项目的团队是一群学校里的大学生,他们在毕业之后还在继续这个项目。不久之后,IBM看中了这个项目,并决定资助研发团队,这个项目随之改名为“深思”(Deep Thought)项目的目标也从最初的目的变为了建造出一台可以击败人类顶尖棋手的国际象棋计算机。

当时在博弈方面,已经构建出了博弈树搜索概念的程序:Minimax算法,该算法主要目的是在对抗博弈中,找寻最优决策。该算法通过递归的方式,对博弈局面构成的博弈树进行遍历搜索,通过计算出每个博弈分支节点的值,然后根据节点所在的深度和玩家角色来选择出当下的最优决策。

然而由于国际象棋的对弈局面极为庞杂,尤其是中局阶段,交错局面构建出的博弈树远远超过了计算机的计算运行能力。所以Minimax算法虽然可以用来运算较为简单的博弈游戏——比如井字棋一类,但对于更复杂的棋类则显得有些吃力。

之后,在Minimax算法的基础上,人们为了降低计算机的计算量,想到了对博弈树进行“剪枝”的操作方法。由于Minimax算法的运行模式是“遍历”搜索树,而实际上很多局面的分支并不能导向最优解,故而遍历这种暴力式的穷举方式,对于复杂的局面就显得很浪费计算资源。

人机博弈续:国、中、围三棋人机巅峰战 8%title%

于是就有了Alpha-Beta剪枝算法。该算法是在Minimax的基础上,引入了Alpha和Beta两个参数,用以对博弈树进行剪枝。简单来说,Alpha和Beta这两个参数分别代表着博弈双方当前的最佳选择值。那么于是这就在两个参数中间,规划出了一个最佳选择的范围。在搜索博弈树的过程中,如果某个节点的值一旦超出了Alpha或者Beta的参数范围,那么就可以剪掉该节点以及其引申出的分支——因为对于当前玩家来说,这个分支选择不会被纳入考量范围。(通俗点来说:当下局面中,玩家为了获胜不会故意走败招。)

在Alpha-Beta剪枝算法运行初始,Alpha和Beta两个参数分别为负无穷和正无穷。这代表着博弈双方当前的最佳选择值。(局面初期阶段,双方均有无限种可能的选择。)然后开始递归遍历博弈搜索树,并判断当前节点:Max节点对应Alpha的值,Min节点对应Beta的值。随着这两种节点的子节点遍历,Alpha和Beta两个参数会不断的更新——随着博弈双方的不断行棋,双方的胜率就会发生变化。

同时在进行子节点遍历搜索的过程中,一旦发现节点的值超出Alpha和Beta两个参数的范围,那么该节点和延伸的子分支就会被剪除。于是根据Alpha和Beta的更新情况不断地进行剪枝操作,直到Beta的值小于等于Alpha的值,即代表已找到了当下博弈局面的最佳决策,那么就提前终止搜索。一旦找到最佳决策的分支节点,则开始不断的从子节点递归返回,并把节点的值传回来。如果返回当前的节点是Max节点,就返回Alpha值(最大值),如果当前节点是Min节点,就返回Bsta值(最小值)。

上述过程会不断的往复,一直到整个博弈获得最终结果为止。这个剪枝算法,在搜索庞大空间的复杂问题时,具有着非常明显的优势。它通过剪枝操作,极大地提高了博弈树搜索的效率。同时,可以看出,为了获得博弈胜利,单纯有搜索博弈树的算法还不够,还需要搭载一个局面价值评估系统,用以引导搜索系统来找到“更有希望”的局面价值——胜率越高则价值越大,反之则价值越小,甚至是负价值。于是这个算法也就成为了超级计算机下国际象棋的系统核心。

人机博弈续:国、中、围三棋人机巅峰战 9%title%

1989年,该项目还叫“深思”的时候,就与卡斯帕罗夫进行过一次比赛,结果是卡斯帕罗夫胜出。之后IBM就将这套超级计算机重新起名为“深蓝”(Deep Blue),IBM将大学最早的研发团队招入麾下,并协助项目的筹备与开发。IBM供应了当时最好的计算机硬件设备,以定制的超大规模集成电路打造了计算机的硬件系统。深蓝是并行计算的电脑系统,将通用超级计算机处理器与象棋加速器芯片相结合。在超级计算机上运行的软件执行一部分运算,更复杂的棋步交给加速器处理,然后计算出可能的棋步和结果。计算处理器建基于RS/6000SP,另加上480颗特别制造的VLSI象棋芯片。下棋程式以C语言写成,运行AIX操作系统。1996年刚刚完成的版本,其运算速度为每秒1亿次,之后在1997年又进行了一次升级,运算速度达到了每秒2亿步棋,是其1996年版本的2倍。其计算能力为每秒113.8亿次浮点运算。

人机博弈续:国、中、围三棋人机巅峰战 10%title%

2·3:1997年国际象棋六番战

卡斯帕罗夫与“深蓝”于1996年和1997年分别进行了两场比赛,共计12局棋。1996年的人机大战,最终是卡斯帕罗夫获胜,赢得了40万美元的奖金;而本文将要详细描述的则是在那之后,于1997年发生的人机大战,这次IBM公司共投入了资金1000万美元,出资110万美元作为比赛的奖金,最终胜者可获得奖金70万美元。

彼时“深蓝”已经经过了一轮强化,被称为“更深的蓝”,但是为了方便叙述,还是称其为“深蓝”。1997年5月3日,卡斯帕罗夫VS深蓝的战斗正式打响!

第一局:卡斯帕罗夫执白,深蓝执黑:

人机博弈续:国、中、围三棋人机巅峰战 11%title%

第一局棋谱:

1. Nf3 d5 2. g3 Bg4 3. b3 Nd7 4. Bb2 e6 5. Bg2 Ngf6 6. O-O c6 7. d3 Bd6 8. Nbd2 O-O 9. h3 Bh5 10. e3 h6 11. Qe1 Qa5 12. a3 Bc7 13. Nh4 g5 14. Nhf3 e5 15. e4 Rfe8 16. Nh2 Qb6 17. Qc1 a5 18. Re1 Bd6 19. Ndf1 dxe4 20. dxe4 Bc5 21. Ne3 Rad8 22. Nhf1 g4 23. hxg4 Nxg4 24. f3 Nxe3 25. Nxe3 Be7 26. Kh1 Bg5 27. Re2 a4 28. b4 f5 29. exf5 e4 30. f4 Bxe2 31. fxg5 Ne5 32. g6 Bf3 33. Bc3 Qb5 34. Qf1 Qxf1+ 35. Rxf1 h5 36. Kg1 Kf8 37. Bh3 b5 38. Kf2 Kg7 39. g4 Kh6 40. Rg1 hxg4 41. Bxg4 Bxg4 42. Nxg4+ Nxg4+ 43. Rxg4 Rd5 44. f6 Rd1 45. g7

第一局棋最值得一聊,彼时卡斯帕罗夫经过了96年的人机大战,面对超级计算机,他有意识地做了准备。他知道当时的深蓝已经输入了庞大的开局库,用以学习计算人类的棋谱。于是他首先就选择了一个极为冷僻的开局“Nf3 d5”这个开局,在今天的国际象棋开局里,被归到了不规则开局的一类中。卡斯帕罗夫很清楚,面对电脑这种冷冰冰的利益最大化行棋风格,保持机动性和复杂性的棋步是最好的应对手段。

前三个回合里,卡斯帕罗夫有意试探深蓝对棋局的处理能力。他故意提供了一些机会,来看看电脑对于子力价值的估算。同时他也在尝试将深蓝引离预先准备好的开局库。之后双方你来我往,一直行棋到了第8个回合。卡斯帕罗夫的引离战术似乎是失败了,因为深蓝的运转显示,它很明显又回到了自己的开局库里。

又过了几个回合之后,卡斯帕罗夫下出了一个很精妙的“试应手”,有意将选择局面的权利交给了深蓝,让电脑来选择战场究竟是在棋盘上的哪一侧。在后来的纪录片里,卡斯帕罗夫表示,自己有意做了一个“弃子争先”的战术引导,因为他猜测当时的电脑会谋求利益最大化而“贪吃”,如果当时电脑这样做了,就会被引入到他设计好的圈套里面。于是令人惊讶的一幕就这样发生了:深蓝没有贪吃,并且找出了一路新的变化。

紧接着,卡斯帕罗夫就尝试将战场转移到棋盘上的王翼一侧,他的“两难选择”战术还是生效了,白棋在随后的几步里,将子力逐渐的聚集到了王翼一侧,而之后深蓝的应对显得有些单薄——计算机尝试在另一侧尽可能地获取实地,但是这个想法导致它的黑后过于孤军深入白棋腹地。果然,在第12回合,卡斯帕罗夫封锁了黑棋的后翼,整个棋盘上的主动权握在了他的手上。

在这个局面下,卡斯帕罗夫明显占据了主动权,一直到第14回合,深蓝都没有做出很好的应对,使得黑棋落入了下风。之后,深蓝依旧凭借着强大的计算能力在支撑着,而卡斯帕罗夫作为人类,虽然在局面上获得了优势,但在后面的几步棋走的略微保守了一些,这给了黑棋一些机会。又进行了几个回合之后,黑白双方依然在缠斗。

直到第22回合,深蓝走出了一步险招,打算强行突破局面。但是这破坏了自己的兵形,使得后面的很多战略部署无法展开。然而在第24回合时,卡斯帕罗夫也出现了失误,原本他所享有的优势出现了大缩水。双方激战到第28个回合时,卡斯帕罗夫依然占据优势,眼看即将对深蓝发起攻击。

没想到第29回合,深蓝走出了一步惊人的f5,事后多位特级大师研究发现,深蓝走出了类似“骗招”的棋步,如果当时卡斯帕罗夫贪心,则很有可能被深蓝逆转。而卡斯帕罗夫终究是当时的人类第一,他显然算到了这一步“迷局”。于是他有意的绕开了激进的战术,将局面导向稳健,从而维持住自己的优势。这几个回合的较量,在事后令IBM的人员都感到惊叹,卡斯帕罗夫与深蓝对这一局面的深度计算针锋相对,互不相让。至32回合,深蓝凭借强大的计算能力,将黑白双方之间的差距缩短了,不过卡斯帕罗夫作为当时的人类第一,并没有让胜机从自己的手里溜掉。

行棋至34回合,卡斯帕罗夫终于把局面导向了自己想要的白方优势残局。在残局的战斗里,深蓝显得十分顽强,但是最终还是被卡斯帕罗夫依靠优势子力,换取到了胜势,在第45回合,深蓝投降。最终经过了3个小时的激战,卡斯帕罗夫作为人类代表率先拿下一城!

第二局:卡斯帕罗夫执黑,深蓝执白

人机博弈续:国、中、围三棋人机巅峰战 12%title%

第二局棋谱:

1. e4 e5 2. Nf3 Nc6 3. Bb5 a6 4. Ba4 Nf6 5. O-O Be7 6. Re1 b5 7. Bb3 d6 8. c3 O-O 9. h3 h6 10. d4 Re8 11. Nbd2 Bf8 12. Nf1 Bd7 13. Ng3 Na5 14. Bc2 c5 15. b3 Nc6 16. d5 Ne7 17. Be3 Ng6 18. Qd2 Nh7 19. a4 Nh4 20. Nxh4 Qxh4 21. Qe2 Qd8 22. b4 Qc7 23. Rec1 c4 24. Ra3 Rec8 25. Rca1 Qd8 26. f4 Nf6 27. fxe5 dxe5 28. Qf1 Ne8 29. Qf2 Nd6 30. Bb6 Qe8 31. R3a2 Be7 32. Bc5 Bf8 33. Nf5 Bxf5 34. exf5 f6 35. Bxd6 Bxd6 36. axb5 axb5 37. Be4 Rxa2 38. Qxa2 Qd7 39. Qa7 Rc7 40. Qb6 Rb7 41. Ra8+ Kf7 42. Qa6 Qc7 43. Qc6 Qb6+ 44. Kf1 Rb8 45. Ra6

本盘棋,卡斯帕罗夫依然坚定的贯彻自己走冷门开局的战术。他选择了他执后手几乎没下过的西班牙开局斯梅斯洛夫变例,然而由于对局面的不熟悉,使得卡斯帕罗夫将棋局的主动权拱手交了出去。深蓝长久的掌握着棋盘上的空间优势,使得白棋在两翼都可以对黑棋发动攻势,黑方需要长时间保持防御姿态寻求均势,这样的被动防守并不适合卡斯帕罗夫的风格。最终在45回合的较量之后,深蓝获得了胜利。

卡斯帕罗夫当时以为,在同样陌生的局面下,人类的应对应该会优于电脑,但他忘记了这也让自己陷入了被动的局面里面。而当时深蓝已经显示出了强大计算力作为支撑的一些特性——电脑下棋特别顽强,只要找到一个机会就能扳回局面。最终第二局,卡斯帕罗夫告负,

第三局:卡斯帕罗夫执白,深蓝执黑

人机博弈续:国、中、围三棋人机巅峰战 13%title%

第三局棋谱:

1. d3 e5 2. Nf3 Nc6 3. c4 Nf6 4. a3 d6 5. Nc3 Be7 6. g3 O-O 7. Bg2 Be6 8. O-O Qd7 9. Ng5 Bf5 10. e4 Bg4 11. f3 Bh5 12. Nh3 Nd4 13. Nf2 h6 14. Be3 c5 15. b4 b6 16. Rb1 Kh8 17. Rb2 a6 18. bxc5 bxc5 19. Bh3 Qc7 20. Bg4 Bg6 21. f4 exf4 22. gxf4 Qa5 23. Bd2 Qxa3 24. Ra2 Qb3 25. f5 Qxd1 26. Bxd1 Bh7 27. Nh3 Rfb8 28. Nf4 Bd8 29. Nfd5 Nc6 30. Bf4 Ne5 31. Ba4 Nxd5 32. Nxd5 a5 33. Bb5 Ra7 34. Kg2 g5 35. Bxe5+ dxe5 36. f6 Bg6 37. h4 gxh4 38. Kh3 Kg8 39. Kxh4 Kh7 40. Kg4 Bc7 41. Nxc7 Rxc7 42. Rxa5 Rd8 43. Rf3 Kh8 44. Kh4 Kg8 45. Ra3 Kh8 46. Ra6 Kh7 47. Ra3 Kh8 48. Ra6

1/2-1/2

这一局,卡斯帕罗夫有意的走d3开局,以此来绕过计算机的开局库。最终双方激战成和。到目前为止,卡斯帕罗夫和深蓝的较量,双方平局。

第四局:卡斯帕罗夫执黑,深蓝执白

人机博弈续:国、中、围三棋人机巅峰战 14%title%

第四局棋谱:

1. e4 c6 2. d4 d6 3. Nf3 Nf6 4. Nc3 Bg4 5. h3 Bh5 6. Bd3 e6 7. Qe2 d5 8. Bg5 Be7 9. e5 Nfd7 10. Bxe7 Qxe7 11. g4 Bg6 12. Bxg6 hxg6 13. h4 Na6 14. O-O-O O-O-O 15. Rdg1 Nc7 16. Kb1 f6 17. exf6 Qxf6 18. Rg3 Rde8 19. Re1 Rhf8 20. Nd1 e5 21. dxe5 Qf4 22. a3 Ne6 23. Nc3 Ndc5 24. b4 Nd7 25. Qd3 Qf7 26. b5 Ndc5 27. Qe3 Qf4 28. bxc6 bxc6 29. Rd1 Kc7 30. Ka1 Qxe3 31. fxe3 Rf7 32. Rh3 Ref8 33. Nd4 Rf2 34. Rb1 Rg2 35. Nce2 Rxg4 36. Nxe6+ Nxe6 37. Nd4 Nxd4 38. exd4 Rxd4 39. Rg1 Rc4 40. Rxg6 Rxc2 41. Rxg7+ Kb6 42. Rb3+ Kc5 43. Rxa7 Rf1+ 44. Rb1 Rff2 45. Rb4 Rc1+ 46. Rb1 Rcc2 47. Rb4 Rc1+ 48. Rb1 Rxb1+ 49. Kxb1 Re2 50. Re7 Rh2 51. Rh7 Kc4 52. Rc7 c5 53. e6 Rxh4 54. e7 Re4 55. a4 Kb3 56. Kc1

1/2-1/2

本局双方依然战和,深蓝的表现很明显在不断的进步,但卡斯帕罗夫作为当时的人类第一,应对的也非常漂亮。双方目前为止始终都拿不下对手。

第五局:卡斯帕罗夫执白,深蓝执黑

人机博弈续:国、中、围三棋人机巅峰战 15%title%

第五局棋谱:

1. Nf3 d5 2. g3 Bg4 3. Bg2 Nd7 4. h3 Bxf3 5. Bxf3 c6 6. d3 e6 7. e4 Ne5 8. Bg2 dxe4 9. Bxe4 Nf6 10. Bg2 Bb4+ 11. Nd2 h5 12. Qe2 Qc7 13. c3 Be7 14. d4 Ng6 15. h4 e5 16. Nf3 exd4 17. Nxd4 O-O-O 18. Bg5 Ng4 19. O-O-O Rhe8 20. Qc2 Kb8 21. Kb1 Bxg5 22. hxg5 N6e5 23. Rhe1 c5 24. Nf3 Rxd1+ 25. Rxd1 Nc4 26. Qa4 Rd8 27. Re1 Nb6 28. Qc2 Qd6 29. c4 Qg6 30. Qxg6 fxg6 31. b3 Nxf2 32. Re6 Kc7 33. Rxg6 Rd7 34. Nh4 Nc8 35. Bd5 Nd6 36. Re6 Nb5 37. cxb5 Rxd5 38. Rg6 Rd7 39. Nf5 Ne4 40. Nxg7 Rd1+ 41. Kc2 Rd2+ 42. Kc1 Rxa2 43. Nxh5 Nd2 44. Nf4 Nxb3+ 45. Kb1 Rd2 46. Re6 c4 47. Re3 Kb6 48. g6 Kxb5 49. g7 Kb4

1/2-1/2

本局棋,原本卡斯帕罗夫已经获取了一些优势,然而没想到深蓝利用规则长将,强行逼迫卡斯帕罗夫和棋。事后也有人认为,正是这一局棋卡斯帕罗夫没能拿下深蓝,导致后面的第六局加赛心态失衡,才被深蓝得胜。

第六局(加赛):卡斯帕罗夫执黑,深蓝执白

人机博弈续:国、中、围三棋人机巅峰战 16%title%

第六局棋谱:

1. e4 c6 2. d4 d5 3. Nc3 dxe4 4. Nxe4 Nd7 5. Ng5 Ngf6 6. Bd3 e6 7. N1f3 h6 8. Nxe6 Qe7 9. O-O fxe6 10. Bg6+ Kd8 11. Bf4 b5 12. a4 Bb7 13. Re1 Nd5 14. Bg3 Kc8 15. axb5 cxb5 16. Qd3 Bc6 17. Bf5 exf5 18. Rxe7 Bxe7 19. c4

1-0

本局棋,卡斯帕罗夫第一次采取了“常规”的下法。最初的几步棋让观看的棋迷们欢欣鼓舞,以为强大的卡斯帕罗夫恢复了他的本来面目。但很快欢欣就成了沮丧。第七回合,卡斯帕罗夫犯了一个不可挽回的低级错误,局势急转直下,很快卡斯帕罗夫就已毫无希望。在挣扎了几步之后,他放弃了抵抗。最终第六局被深蓝拿下。

六局战罢,卡斯帕罗夫对深蓝战绩;2.5:3.5

深蓝以微弱优势获胜,战后IBM团队宣布深蓝退役不再参加任何比赛。

三:2006年,许银川VS浪潮天梭——鬼手对撞

有关于中国象棋,它曾经是几代人的普及娱乐项目。今天在中国,不能说人人都会下,但至少人人都不陌生。然而事实上,中国象棋可能比我们以为的要陌生些。因为今天的大部分人,也许对于中国象棋的了解,仅限于最基础的行棋规则,除此之外都没有什么兴趣了解了。当然这也是很正常的一件事,中国象棋曾经是中国几代人都很普及的娱乐项目,然而在娱乐多元化的今天,它似乎已经逐渐淡出了——现在一谈中国象棋,人们似乎第一反应都是想到那些坐在街边,闲来无事走两盘棋的棋摊大爷们……

人机博弈续:国、中、围三棋人机巅峰战 17%title%

但是在这里,我们还是不得不先用一些篇幅来大致介绍一下,这个我们熟悉却又陌生的中国象棋:

中国象棋是完全起源于中国的一种棋类游戏,属于一种二人对抗性游戏。中国象棋使用方形格状棋盘,圆形棋子共有32个,分红黑二色。双方各有16个棋子,摆放和活动在交叉点上。游戏开始后(一般遵循红先黑后的起始顺序),双方交替行棋,消灭掉对方的皇帝棋子(“将”或”帅”)即可获得胜利。

象棋一词最早出现于战国时期。《楚辞·招魂》中就对其形制以及玩乐方法作过专门记载:“蓖蔽象棋,有六簿些;分营并进,道相迫些;成枭而牟,呼五白些。”中国象棋的最早起源说法很多,往上可以追溯到炎黄时代,近一点的也能追溯至楚汉相争年代。

象棋作为模拟古代战争的智力游戏,每一局都在咫尺棋盘上演绎着金戈铁马、兵戎相见。棋盘上的车、马、炮、兵就是古代的战车、战马、火炮(或者投石车)和士兵的象征。相比其他体育运动项目,象棋与古代军事有着最为直接的内在联系,其战略思想和战术特征受到了古代军事思想的影响。

迄今所知,中国最古老的棋戏是六博和围棋,二者并称博弈。春秋以前的围棋活动已无从查证,据可靠的记载,迟至春秋时期才有人以弈喻事。六博的出现比围棋略早,《穆天子传》记载,周穆王曾跟进公下了三天六博棋角胜负,至春秋时代博弈已并行于世。《论语·阳货》载:“子曰:饱食终日,无所用心,难矣哉!不有博弈者乎?为之,犹贤乎已”;据研究表明,秦代六博棋是象棋的鼻祖。

人机博弈续:国、中、围三棋人机巅峰战 18%title%

到三国时期,象棋的形制不断地变化,并已和印度有了传播关系;至南北朝时期的北周朝代,武帝制《象经》,王褒写《象戏·序》,庚信写《象戏经赋》。象戏正式成型,对于象戏的记载,最早出自二十四史。《北史》卷十,天和四年有“五月己丑,帝制《象经》成,集百僚讲说”,《周书》卷五所记相同。

直到唐代,象戏进一步向更广为人知的象棋形式靠拢。唐代的象棋形制,和早期的国际象棋有颇多相似之处。当时象棋的流行情况,多见自诗文传记载中。当时的象棋已有“将、马、车、卒”4个兵种,由黑白相间的64个方格组成。后来又参照中国的围棋,把64个方格变为90个点。这种象戏被称为“宝应象棋”,将象戏作为象棋的代称。

宋代是象棋广泛流行,形制大变革的时代。北宋时期,先后有司马光的《七国象戏》,尹洙的《象戏格》、《棋势》,晁补之的《广象戏图》等著术问世,民间还流行“大象戏”。除了因火药的发明增加了棋子“炮”之外,还增加了“士”、“象”。即在使用带有九宫的棋盘基础上,吸收和借鉴其他棋类的棋子种类并将其中三个兵升级成一个士及两个炮,以符合当时人的趣味。彼时,中国象棋的形制已基本确定,和今天我们所知的几乎没有太大差别。

到明清时期,象棋又有了很大的发展,涌现出了不少象棋名手和论述象棋的专著。明代象棋专著有《金鹏十八变》、《梦入神机》、《橘中秘》等,而由徐芝精选的《适情雅趣》是象棋古谱中最系统、完整、实用的一种。《橘中秘》谱多为和棋,以斗炮局为主。个别排局已经涉及古代象棋规则问题,利用规则当中的“将”、“杀”等战术手段而达到和棋的目的。不难看出,在明代,象棋技术水平和技术理论的发展己经开始趋向精细化,棋手和爱好者对象棋的要求也不再仅仅满足在排局构思巧妙和杀法精彩的层面。象棋的理论发展与技战术融合又迈进了重要的一步。

清代是中国象棋发展的全盛时期,名家辈出,名谱众多。有关象棋著作有《梅花泉》、《韬元机略》、《心武残篇》、《竹香斋象戏谱》、《百变象棋谱》等。其中王再越著《梅花谱》是中国象棋史上一部带有划时代意义的棋谱,它因战例丰富、变化精微而著称, 开创了中国象棋历史上,迄今三百余年“马炮争雄”的历史篇章。不仅如此,象棋著名的四大排局“七星聚会、野马操田、千里独行和蚯蚓降龙”也都是在清代完成的。这四个排局各具特色,但都是围绕车、马、炮、兵相互配合而展开,这些排局迄今为止仍然是公认的难度最高,最为复杂的。可以说清代是古代象棋发展理论和技术战术水平达到巅峰的历史阶段,也为现代中国象棋的发展奠定了足够的基础。

1956年,国家体委(现国家体育总局)将象棋列入第一批体育项目之中,当年北京就举行了中国第一次全国性的象棋比赛一一全国象棋锦标赛。有30人代表不同省份参赛,可以说是盛况空前。这次赛事的举办,也标志着象棋从传统文化中的“艺”向竞技体育发展的一个正式转折。象棋是这次比赛当中棋类项目的正式比赛项目,录取前6名,而围棋和国际象棋都作为了表演项目不计算名次。同年,中国象棋第一本期刊类杂志《象棋》出版发行。1956年是一个里程碑式的重要时刻,也是标志着象棋从“江湖”到“庙堂”的重要转折点。散落于民间“难登大雅”的中国象棋,从此有了正式的归属。此后各省、自治区、直辖市和行业体协的专业队相继组成,在最多的时候有20多支,参赛队伍最多时达到30支左右。

人机博弈续:国、中、围三棋人机巅峰战 19%title%

进入八十年代,象棋运动开始尝试由各地自行举办不同规模和形式的赛事活动,这成就了诸如胡荣华、柳大华、李来群、吕钦、赵国荣等一大批优秀的中国象棋棋手,得到了社会广泛的认可。在全国所有的体育项目当中,中国象棋是较早地开始组织、举办独立邀请赛和杯赛的项目,并开始尝试对优胜名次给予奖励或奖金。比如最早在1981年由霍英东先生赞助创办的第1届“五羊杯全国象棋冠军赛”,按规定冠军奖金不能超过50元人民币,这和20世纪动辄几万到几十万的奖金实在无法比拟。此后连续举办了二十七届,五羊杯不仅成为全国乃至东南亚最有影响力的比赛,也是迄今为止办赛持续时间最长的商业比赛。(后被碧桂园杯代替,至2022年,五羊杯重启)

如今中国象棋已流传到十几个国家和地区,并且还建立了亚洲和世界组织,在日本、菲律宾还成立了中国象棋协会;单年世界象棋联合会举办个人赛,逢双年亚洲象棋联合会举办团体赛。1978年,成立了亚洲象棋联合会。中国象棋在欧美也有了可喜的发展。美国、法国、德国、加拿大等国,纷纷成立了象棋协会或象棋社。一些国际象棋大师也下起了中国象棋。

1988年,为了推动象棋的国际化,在此基础上,“中国中国象棋联合会筹委会”于在北京成立。

1990年,第1届世界杯象棋锦标赛在新加坡举行。

人机博弈续:国、中、围三棋人机巅峰战 20%title%

而人机大战涉足中国象棋则是在2005年,当时中国象棋软件流行的模式是人机结合,软件先计算出各种下法,然后由人去进行选择。在05年的9月30日,当时由两位特级大师,“岭南双雄”吕钦和许银川领军的广东队五员战将以总比分1胜4和5负不敌由电脑与5位业余高手组成的“人机合一”队,这个成绩是象棋软件发展的一个里程碑。

双方战绩如下:

人机 classic 先胜 李鸿嘉 李鸿嘉 先负 人机 classic 许银川 先负 人机 绝情刀

人机 绝情刀 先和 许银川 吕钦 先负 人机 含笑 人机 含笑 先和 吕钦

黄海林 先胜 人机 飞鸿踏雪 人机 飞鸿踏雪 先和 黄海林 人机 梅花雨 先和 陈富杰

陈富杰 先和 人机 梅花雨

在人类顶尖高手与棋软的对战中,最为轰动的当属2006年8月9日,中国象棋史上,首次顶尖人机大战拉开了序幕,国产计算机“浪潮天梭”服务器运行的象棋软件,以11:9的总分,击败了由柳大华、卜凤波、徐天红、张强、汪洋组成的特级大师联盟。这次的人机大战,机方已经排除了人为选择的因素,单纯由软件自行选择下法来跟人类对抗。

最终战绩如下:

汪洋 浪潮天梭 浪潮天梭 汪洋 浪潮天梭 柳大华 浪潮天梭 徐天红

柳大华 浪潮天梭 张强 浪潮天梭 浪潮天梭 张强 徐天红 浪潮天梭

卜凤波 浪潮天梭 浪潮天梭 卜凤波

为了捍卫人类尊严,仅仅6天后,即8月15日,当时集世界、亚洲和全国冠军于一身,同时也是当时等级分排名第一的“中国象棋第一人”许银川,毅然接受了“浪潮天梭”的高调挑战,与浪潮天梭服务器运行的软件“棋天大圣”展开人机大对决,最后双方两战皆和,打为平手。

人机博弈续:国、中、围三棋人机巅峰战 21%title%

3·1:中国象棋特级大师许银川

许银川,1975年8月出生于广东省揭阳市惠来县。中国象棋特级大师,外号“许仙”、“少年姜太公”,全国个人赛六冠王。全国、亚洲、国际三大赛事的“全冠王”。

许银川4岁就开始学下棋,启蒙老师是曾多次取得县冠军的父亲。10岁时,许银川就获得了汕头市少年象棋比赛冠军。接着,他受到汕头市体校象棋教练章汉强的辅导。

1986年,在第7届广东省运动会象棋比赛中,这位11岁的小棋手一鸣惊人,夺得省少年冠军。随后,许银川跻身于广东省棋队。入省象棋队后,他生活的全部内容便是象棋,十年如一日准时来到训练室,每天训练近6小时。在省队训练,许银川的棋艺水平迅猛提高。

许银川的棋风灵活多变,基本功扎实,技术全面。其以绵密、细腻的棋风,胸有成竹的心态,在强手如林的全国象棋大赛中,崭露头角,被称为“少年姜太公”。他是继杨官璘、吕钦之后,在南粤升起的又一颗棋坛新星。

1993年“青岛隆泰长青杯”全国象棋个人锦标赛上,18岁的许银川以8胜4和1负积10分的成绩荣登全国冠军宝座,是继胡荣华之后30年中最年轻的男子全国冠军和特级大师,成为中国象棋史上的第9位全国冠军。

许银川夺冠后才觉得跻身于一流的象棋大师行列,他和另一位特级大师吕钦各有所长,下棋也互有输赢。许银川与吕钦成为了良师益友,二人经常一起下棋探讨,互有受益。而在生活中,俩人也有共同爱好,虽然年纪相差较大,但却是忘年之交。而在象棋比赛中,因两人风格迥异,却同样出色的成绩,被并称为“岭南双雄”。

同时许银川也是继“新东北虎”赵国荣、“快马飞刀”吕钦之后,第三位集世界、亚洲、全国冠军于一身的“全冠王”。

1991、1997、2014年许银川分别获全国个人赛第三名,而在1993年、1996年、1998年、2001年、2006年、2009年,许银川又分别六次获全国冠军,1995、2000,2011年获得全国亚军,是1989、1993、1999、2000、2001、2002年六届全国团体冠军广东队及2004年“将军杯”、2006年“启新高尔夫杯”全国象棋甲级联赛冠军广东队主力,2003年首届象甲联赛中许银川获得最高胜率奖。

2022年,许银川宣布正式退役。

人机博弈续:国、中、围三棋人机巅峰战 22%title%

3·2:浪潮天梭

要说中国象棋软件的发展和成熟,实际上要比国际象棋软件要晚一些。中国象棋软件的发明大概是2001年前后。最早成型的象棋软件,是由中山大学的研究生涂志坚研发的“纵马奔流(ZMBL)”象棋软件。这个软件在第8届电脑奥林匹克大赛上,以6胜2和的绝对优势轻松夺冠,据说此软件已经达到了普通象棋大师的水准。

从“纵马奔流”开始,就构建出了中国象棋AI的基本架构:开局知识库、搜索引擎、评价函数以及一系列知识学习机制。开局以及残局知识库,让程序的搜索范围得到了一定的缩小——很多得到验证的固定开局并不需要进行搜索。然后是搜索引擎,当时在原有基础上已经发展出了更高效更具有针对性的剪枝搜索算法,搭配合理的函数评价,使得计算机在最复杂的中局阶段可以高效的搜索出“当下最优解”。另外算法的进步也让搜索引擎的广度和深度得到了扩充。

有了“纵马奔流(ZMBL)”开的先河,后面的象棋软件便如雨后春笋:象棋世家、棋隐、象棋奇兵、棋天大圣、旋风、名手、天机、小虫等等,层出不穷,几乎每隔一段时间就会有新的软件版本面世。水平也在不断的提高。由东北大学于2005年推出的“棋天大圣”便是日后最知名的象棋软件之一,也是具有里程碑意义的一款象棋软件。

“棋天大圣”一经推出便表现出了强大的开中残棋力,先后在国际国内的中国象棋软件大赛中取得佳绩:2006年意大利举办的第11届世界奥林匹克象棋软件大赛上,“棋天大圣”获得了冠军;2006年北京浪潮象棋软件大赛上,又获冠军;2007年第12届世界奥林匹克象棋软件大赛;2007年台湾举办的全球电脑争霸赛均获得冠军。但2007年后“棋天大圣”的改进遇到较大问题,棋力开始逐步落后于象棋旋风等软件,2008年棋天大圣分别派出快棋版和慢棋版参加当年的棋软大赛,分别只获得了第5和第6名,成绩十分不理想,此后作者便终止了该软件的继续开发,其终极版本止步在“棋天大圣”5.1版。

不过“棋天大圣”最知名的战绩,还是要属其于2006年,与中国象棋特级大师,当时等级分最高的许银川两战成和。

当时“棋天大圣”得到了超级计算机浪潮天梭的硬件支持:浪潮天梭运行使用了4台服务器,总共16核心。采用的是Intel Xeon处理器,每个节点配置了两个Xeon处理器,总共有数千个节点。同时,每个节点还配备了一张nVIDIA FX5500显卡。其运算能力达到了每步可以做66万亿次的棋位分析与检索

人机博弈续:国、中、围三棋人机巅峰战 23%title%

3·3:中国象棋两番战

第一局:许银川执黑,浪潮天梭执红

人机博弈续:国、中、围三棋人机巅峰战 24%title%

第一局棋谱:

1.炮二平五马8进7   2.马二进三车9平8 3.车一平二马2进3   4.兵七进一卒7进1 5.车二进六炮8平9   6.车二平三炮9退1 7.炮八平六马3退5   8.车三退一象3进5 9.车三平六马5进3   10.车六进一马7进6 11.车六平七炮9进1  12.兵三进一士4进5 13.兵三进一马6进4   14.车七平八炮2退2 15.马八进七马4进6   16.车九进一马6退7 17.马七进六炮2平4  18.马六进四车1进1 19.车九平七车8进4   20.兵七进一马7进8 21.马三进二炮9平8   22.兵七进一炮8进3 23.马四退二车1平4  24.炮六进七马3退4 25.炮五平二车4进5   26.车七进一车4平5 27.仕四进五车5平1   28.车八退二车1平7 29.相三进一车7平5  30.车八平七卒5进1 31.车七平五车5进1   32.相七进五车8平7 33.车七退一马8退6   34.相五进三卒9进1 35.车七进一马6进4   36.兵七平六车7平6 37.炮二平六车6进1   38.车七进二车6进1 39.相一退三卒1进1   40.车七平九马4退3 41.车九退一马3进2   42.车九平六马2进4

前五个回合为开局阶段,双方你来我往,走成了中炮过河车对屏风马互进七兵卒平炮兑车的局面。浪潮天梭走五六炮的布局,准备布成一个攻守兼备的阵势。许银川马退窝心,准备平炮打死车抢先手。浪潮天梭退车吃卒,避开了打死车的局面。到此为止双方走的还是谱招。接着许银川飞相踩车,等浪潮天梭将车躲开,就立刻跳出了窝心马防止被红方针对性进攻。

到第11个回合许银川依然保持非常稳健的阵型,黑棋整体攻守兼备,随时瞄准红棋的弱点准备抢先手。第12回合,浪潮天梭兵三进一,准备配合中路强攻。因为许银川的黑棋整体呈现一个连环防守的阵势,想要突破就得集中攻击一点。许银川发现了电脑的意图,于是中路补强,当红棋三路兵跨过楚河汉界时,黑马越过河界攻击红车抢先。同时许银川的撑士也是为后续黑车从肋道出击做准备,浪潮天梭随后通过计算,避开了许银川准备好的局面。

至第14回合,左侧的缠斗暂告一段落,双方都无法攻破对手的防御阵型。于是许银川调整过河的黑马,转而从棋盘的右侧发动进攻。几个回合之后,趁着浪潮天梭调整左侧子力的间隙,许银川通过抢先消灭了红方的过河卒,至此双方再次进入平稳的局面继续对峙。

17回合开始,浪潮天梭再次酝酿强攻,红马连续跳跃,试探黑方,一边逼迫兑子,一边配合双车一兵从左侧逐步推进。这对黑棋的左侧产生了巨大的压力。然而许银川恰恰非常善于这样的平稳推进,几招棋之后就化解了电脑强攻的策略。这几个回合的较量中,许银川淋漓尽致的发挥了自己绵密的棋风。电脑极其凶狠的强攻愣是突破不了黑棋的防线,始终被黑棋阻挡在了兵线位置难以再进一步。

从25回合至31回合,许银川不断地消解浪潮天梭的进攻手段,原本他看见了一路强攻手段,然而考虑到人类与电脑的计算力差距,后续的弃子强攻他并没有把握。于是最终许银川选择把局面拉入平稳。第32回合双方兑掉一个车,局面依然焦灼。

走到第36回合的时候,这局棋已经走了几个小时了。许银川感受到自己可能因为体力下降而落入被动。于是选择顶和的策略,在最后的几个回合,许银川成功的兑掉了双方的一个大子——马换炮。最后双方彻底进入必和残局,经历了数个小时的激战,许银川与浪潮天梭的第一战激战成和。

第二局:许银川执红,浪潮天梭执黑

人机博弈续:国、中、围三棋人机巅峰战 25%title%

第二局棋谱:

1.相三进五炮8平4    2.马二进三卒7进1 3.车一平二马8进7   4.兵七进一车9平8 5.马八进七象3进5    6.炮八平九马2进4 7.车九平八卒3进1     8.兵七进一车1平3 9.车八进五车8进6     10.马七进六车3进4 11.车八平七象5进3   12.兵三进一卒7进1 13.相五进三车8平7   14.相三退五炮2进7 15.马三退五炮2平4   16.车二平三车7进3 17.相五退三炮4退1   18.炮九进四炮4平5 19.马五进三卒5进1   20.仕四进五炮4退2 21.炮二进二象3退1   22.相七进五卒9进1 23.炮九平三马7进9   24.炮二进一象1退3 25.马六进八马9退8   26.炮三退一炮5平9 27.炮三平一马8进7   28.炮一退一炮4平9 29.马三进一炮9进4   30.马八进六马4进3 31.相五进三炮9平1   32.炮二退三炮1退3 33.马六退七炮1进2   34.炮二平三马3退5 35.相三进一士6进5   36.帅五平四炮1平2 37.炮三平五马5进6   38.炮一进五象7进9 39.马七进六马6退5   40.兵五进一卒5进1 41.炮五进五马7退5   42.马六退五

在许银川休息了两个小时之后,第二局对战随即开始。本局双方易位,许银川执先手,他选择了飞相开局,电脑回应过宫炮——这也是人类棋谱中的经典布局。许银川当时走的飞相局也是有意识地在避开电脑可能输入的谱招,尝试走散手路数来和电脑对抗。而浪潮天梭应对的也非常具有针对性。

这一局许银川有意奔着和棋的局面去的。到第12回合,双方各兑掉一个车和三七路的兵卒。随后到第17回合,双方又兑掉一个车。至此棋局进入了“马炮残棋”的阶段。而当时的许银川正是以“鬼魅残功”闻名天下,马炮残棋是他绝对的强项。看得出来,许银川尝试将浪潮天梭拉入自己熟悉的领域来进行对抗。

在中国象棋的“马炮残棋”中,兵的数量尤为关键,因为在这个阶段,兵卒很容易过河,而一旦兵卒过河就可以在空间上获取实地。双方兵卒的数量正是代表着双方对于未来棋盘空间可以掌握的范围。许银川非常明白,于是从第18个回合开始,他就连续利用双炮的组合蚕食浪潮天梭的卒。至第26回合,许银川在局面上已经获得了多兵的优势。但随后浪潮天梭兑子缩小了许银川的优势。

至35回合,双方依然均势,许银川之前多次布下飞刀陷阱均被浪潮天梭破解,而浪潮天梭的抢攻也都被许银川的防守挡下。双方互相牵制,一时间都没有更好的棋可走。又走了几个回合,最终双方均无力再战。许银川看到棋局即将进入必和残局。于是在第42回合,提议议和。至此经过两轮数个小时的激战,双方最终战平。

人机博弈续:国、中、围三棋人机巅峰战 26%title%

四:2017年,柯洁VS Alpha·master——十龙降世

关于围棋的介绍,在机核也已经有了非常精彩的文章。笔者这里再做一次推荐,由本站:“逆天改命ing”老师所撰写的围棋系列文章,可以帮助大家对围棋有一个很好的入门了解。这里先贴上系列文章的目录:

《黑白谁能用入玄:围棋最基础知识》

《绝艺如君天下少:围棋吃子极简“攻略”》

《我叹人生亦如此,在乎围与不围中:围棋围空极简“攻略”》

《双棋未遍局,万物皆为空:随便说说围棋几个历史片段》

《一子能当生死关:围棋吃子方法补遗》

人机博弈续:国、中、围三棋人机巅峰战 27%title%

4·1:柯洁

柯洁于1997年8月2日,出生于浙江省丽水市莲都区的一个普通工薪家庭。他6岁的时候,正式开始学习围棋,师从于周宗强5段。学棋的第二年,又转师郑一兵5段。

2005年2月,柯洁参加在杭州举行的浙江省山海杯少儿围棋赛,夺得乙组冠军,随后到北京求学,并进入聂卫平围棋道场,开始“以成为职业棋手为目标”的训练。07年8月,柯洁就在全国少年儿童围棋锦标赛上首次夺得了个人全国冠军,并因此获得了进军当年世界青少年围棋锦标赛的资格。次年的7月7日至10日,柯洁以07年全国冠军身份代表中国队参加在贵州贵阳举行的第25届世界青少年围棋锦标赛,并夺得了少年组冠军。紧随其后,柯洁又参加了“交通杯”中国围棋职业段位赛,在定段组预赛中以6胜2负的成绩晋级本赛,在本赛中以9胜4负的成绩排名第17位。根据此次定段赛规则,柯洁凭借年龄小的优势,拿到了最后一个定段名额,正式成为围棋职业棋手。

2010年8月,柯洁参加浙江省首届体育大会围棋比赛,获得男子青少年组个人冠军。同年升至二段。次年,柯洁参加国家少年围棋队选拔赛,夺得第一名,并以此获得了参加第28届应氏杯世界青少年围棋锦标赛的资格,最终柯洁斩获青年组冠军,且在之后的4年间包揽了应氏杯世青赛少年组、青年组冠军。同年柯洁晋升职业三段。

同样在2011年,柯洁首次出战中国围棋甲级联赛,效力于马晓春执教的山东队,出场16次,总成绩6胜10负。2012年,柯洁代表浙江建设银行队出战第14届中国围棋甲级联赛,出场17次,总成绩9胜8负。同年又升至四段。2013年,柯洁代表古井贡酒浙江队在第15届中国围棋甲级联赛中出场21次,总成绩15胜6负,其中主将战7胜2负,并获得该赛季围甲联赛新秀奖。

2014年10月24日,柯洁在第16届阿含桐山杯中国围棋快棋公开赛决赛中,执白中盘战胜唐韦星,获得个人职业生涯的首个冠军。2014年,柯洁在第16届中国围棋甲级联赛中,获得总战绩18胜2负,其中开局12连胜,加上上赛季后期6连胜,创造了围甲跨赛季18连胜新记录,荣获当届围甲MVP。同年,柯洁参加第2届百灵杯世界围棋公开赛,在八强赛中击败崔哲瀚,在半决赛三番棋中战胜朴廷桓;2015年1月14日,在五番棋决赛中战胜邱峻,首次夺得世界冠军奖杯,并由此直升职业九段。

2015年3月14日,柯洁在第16届阿含桐山杯中日围棋对抗赛中,执白中盘击败井山裕太,帮助中方连续12次获得对抗赛胜利。12月8日至9日,柯洁在第20届三星杯世界围棋公开赛决赛中击败时越,夺得冠军,成为中国90后棋手首位双冠王。同年,柯洁参加第2届梦百合杯世界围棋公开赛,在半决赛三番棋中击败韩国朴永训;翌年1月5日,在五番棋决赛中战胜韩国棋手李世石,收获个人第三个世界冠军。2015年,柯洁在第17届金立智能手机杯中国围棋甲级联赛中,总战绩16胜5负,主将战15胜5负,包揽多胜榜和主将榜双料第一,获得最有价值棋手和最具人气两项大奖。

人机博弈续:国、中、围三棋人机巅峰战 28%title%

2016年2月11日,柯洁在中国中央电视台贺岁杯围棋赛决赛中,执白中盘击败韩国李世石,获得冠军。3月5日,在上海举行的第17届农心杯第三阶段第14局比赛中,柯洁作为中国队主将执黑243手中盘战胜韩国擂主李世石,帮助中国队实现农心杯三连冠。7月10日,柯洁和於之莹搭档先后战胜韩国朴廷桓、崔精组合和中国台湾陈诗渊、黑嘉嘉组合,夺得世界围棋混双赛冠军。7月18日,世界职业围棋排名网站GoRatings公布最新世界排名,谷歌旗下DeepMind的人工智能系统阿尔法围棋(AlphaGo)以3612分,超越3608分的柯洁成为新的世界第一,连续24个月占据榜首的柯洁暂时退居世界第二的位置。9月29日,柯洁在第18届阿含桐山杯中国围棋快棋公开赛决赛中,执白2又1/4子战胜陈耀烨,再次获得阿含桐山杯冠军。12月8日,柯洁在第21届三星车险杯世界围棋大师赛(即三星杯世界围棋公开赛)决赛中战胜柁嘉熹,实现卫冕,收获个人第四座世界冠军奖杯。2月15日,柯洁获得2016CCTV体坛风云人物年度最佳非奥项目运动员奖提名奖。2016年,柯洁在第18届金立杯中国围棋甲级联赛中,22次担任主将,获得18胜4负的战绩,为升班马云南队夺得联赛亚军,并包揽了最有价值棋手奖、优秀主将奖和最多胜局奖。2016年12月30日至2017年1月3日,柯洁同真身为阿尔法围棋(AlphaGo)升级版的网上神秘棋手“大师”(Master)进行了三局网络对战,以0比3落败。

2017年2月1日,柯洁第5届CCTV贺岁杯中日韩围棋争霸赛决赛中,执白中盘击败日本井山裕太,连续第二年获得贺岁杯的冠军。同年5月23、25、27日在浙江嘉兴桐乡的“中国乌镇围棋峰会”上,柯洁与阿尔法围棋(AlphaGo)举行三番棋大战,最终0比3告负。

与阿尔法围棋程序巅峰对决之后,同年的5月29日至7月17日,柯洁在国际国内比赛中连胜元晟溱、申旻埈等中外围棋高手,取得22连胜的记录。7月19日,在中国围棋甲级联赛第11轮中执黑负于时越,22连胜纪录被终结。这个成绩在围棋史上公认的棋手连胜排行中位列第三,仅次于日本棋手井山裕太的26连胜和韩国棋手李昌镐的24连胜。

同在2017年后半年,柯洁在第8届四维数创杯中国围棋龙星战决赛三番棋中击败李钦诚,首次夺得龙星战冠军。然后又在第8届凤凰世界围棋巅峰对决中,柯洁执白以1又1/4子战胜韩国棋手朴廷桓,获得优胜。10月5日,柯洁和於之莹搭档在世界围棋混双赛上执白中盘战胜日本井山裕太、谢依旻组合,成功卫冕。之后的第5届“利民杯”世界星锐围棋最强战决赛中,柯洁执黑中盘战胜许嘉阳,首夺世界围棋星锐最强战冠军。12月26日,柯洁在第1届新奥杯世界围棋公开赛五番棋决赛中战胜彭立尧,夺得新奥杯冠军,获得个人第五个世界冠军。

2018年,柯洁在2017体育大生意年度峰会的评选中,获得年度体育产业人物。在第6届央视贺岁杯中日韩围棋争霸赛上,柯洁先战胜日本棋手一力辽,后负于韩国棋手朴廷桓,获得亚军,无缘该赛事三连冠。在第19届农心杯世界围棋团体锦标赛第13局比赛中,柯洁作为中国队主将执白中盘不敌韩国队副将金志锡。最终中国队获得农心杯亚军,无缘该赛事五连冠。4月27日,在第1届吴清源杯世界女子围棋赛暨贝瑞基因杯2018世界人工智能围棋大赛中,柯洁与星阵围棋进行人机大战,执白中盘告负。6月7日,在第9届中国围棋龙星战决赛中,柯洁战胜连笑,蝉联冠军,夺得个人第十二冠。6月22日,在第2届巅峰梦想福特撼路者围棋汽车拉力赛决赛中,柯洁执白中盘战胜芈昱廷,成功卫冕。12月1日,在第7届烂柯杯中国围棋冠军赛中,柯洁获得亚军。12月5日,在第23届三星杯世界围棋公开赛决赛中,柯洁击败安国铉,获得冠军。这是柯洁第三次问鼎三星杯,同时获得个人第六个世界冠军。12月19日,在第12届春兰杯世界职业围棋锦标赛半决赛中,柯洁执黑以1/4子不敌韩国棋手朴廷桓,最终无缘决赛。

2019年起,柯洁依然积极参加各类围棋赛事,然而,比起他的巅峰状态之后几年柯洁的状态都有所下滑。但即使如此,柯洁依然是目前中国第一线的围棋职业九段。众多棋迷们依然期盼着柯洁可以重回巅峰。最近的的赛事里,在2023年10月14日,开封·忘忧清乐杯2023第二届中国围棋国手赛决赛上,柯洁九段不敌丁浩九段。11月4日,在第五届全国智力运动会比赛中,柯洁领衔的云南队则收获了一枚铜牌。11月11日,中吉号杯第33届中国围棋名人战闭幕式上,柯洁最终获得了亚军。

人机博弈续:国、中、围三棋人机巅峰战 29%title%

4·2:Alpha·master

有关于·Alpho·master的相关解析,在上一篇附录:《人机博弈》中,就已经提过了。Alpho·master作为一个和之前棋类游戏AI截然不同的全新AI,采用了“深度学习”的神经网络,并且利用蒙特卡洛搜索树作为原理的搜索引擎,搭配上一个局面判断的神经网络,一个行棋计算的神经网络,如此组成了一个全新的,功能强大的围棋AI。

2016年,Alpha·go横空出世,并且与当时的人类顶尖棋手,韩国李世石九段进行了五番棋对战。最终Alpho·go四胜一败取得了胜利。李世石针对Alpho·go进行了全方位的围棋技术考验:乱战、收官、治孤、进攻等。

除了李世石在第四局下出的“神之一手”引发了Alpho·go的bug之外,Alpho·go可以说展现出了全方位的强大。当然,彼时Alpho·go在深度学习方面,依然是以输入人类棋谱为基础的。所以当时Alpho·go下的很多棋,还算是有迹可循。当时有种说法认为,围棋中的乱战局面,很有可能成为AI的弱点,因为这会指数级的增加AI的计算量,而顶尖的人类棋手也许可以利用棋感从中占得先机。

Alpho·go在16年与李世石对弈之后,并没有停下脚步,而是进行了进一步的升级。谷歌团队倾注了大量资源,深度强化了Alpho的学习网络,让其从对阵李世石的V18版本,升级到了V23版本。

人机博弈续:国、中、围三棋人机巅峰战 30%title%

经过多次迭代之后,谷歌团队让两个版本的Alpho进行自我对弈,V23版本完全碾压V18版本。由于有神经网络的“深度学习”架构,Alpho可以在很短时间内就进行上万盘的自我对弈,而从这些对弈中,就可以找到更优化的行棋路线——简单来说,其达成的目的,和之前棋类游戏的剪枝效果类似,将低效率的,不能获胜的行棋路线剪除,让下棋引擎可以更简明地计算出胜率更高的路径。只是这种“剪枝”的原理要比上面的复杂,因为它要应对的是围棋的复杂计算,复杂程度远远超过其它棋类游戏。

2016年12月29日,Alpho·master横空出世,谷歌团队让其以“Master”的代号,在弈城围棋网和野狐围棋网上分别与围棋职业选手进行线上对局测试。之后一共进行了60局测试,多位职业棋手与之进行了对弈。其中甚至包括了中日韩众多的顶尖职业棋手:韩国职业九段朴廷桓(韩国第一高手,世界冠军)、中国职业九段连笑(中国围棋名人头衔)、中国职业九段柯洁(当时的人类第一)、中国职业九段陈耀烨(世界冠军)、中国职业九段范廷钰(世界冠军)、中国职业九段芈昱廷(世界冠军)、中国职业九段唐韦星(世界冠军)、中国职业九段古力(世界冠军)、中国职业九段党毅飞(LG杯冠军)、韩国职业九段朴永训、日本职业九段井山裕太(日本第一高手)、韩国职业九段金志锡(韩国第二高手)、中国棋圣聂卫平……

这60局网棋对弈名动天下,前30局在弈城围棋网,当Master连胜至第15局时,已经引起了整个围棋界的关注。随后开始,中日韩三国九段级别,拥有世界冠军头衔的顶尖棋手纷纷上擂挑战Master。而在第31局,Master转战至野狐围棋网时,众位顶尖职业高手更是群起而攻之,轮番与其展开激战。而随后Master的身份也已经被众人猜出——它就是最新升级版的Alpho·GO。

人机博弈续:国、中、围三棋人机巅峰战 31%title%

60局战罢,Mater获得了史无前例的60局连胜,因为其下网棋的代号,故而也被称为:Alpho·master版本。这个版本虽然也是学习的人类棋谱,但在围棋技术方面已经全方位的超越了上一个版本。而这60盘网棋的棋谱也在之后被公开了出来,成为了围棋迎来AI时代的标志。

当时的60局棋Master走出了很多前所未有的棋路,很多过去的定式思维都被打破。但是在这60局其中,Master的表现也值得研究。其开局大多选择简单的流行开局,走简明的定式变化和下发定型。大局上把控住就能明显占优,然后很快就能获胜。这样的风格对于人类来说显得高深莫测,却也有些乏味——这也是为什么60局之后,人们依然觉得Alpho·master可能不善于乱战,因为从网棋的60盘来看,它确实在尽可能地避开了复杂乱战的局面。

之后的2017年5月,在浙江乌镇举办的围棋峰会上。围棋的人机巅峰对决,当时的围棋世界等级分排名第一的柯洁对阵Alpho·master。这三局棋被世界所瞩目,也开启了一个全新的时代。

4·3:围棋三番战之二:载入史册的人类棋道最高峰

在5月25日第二局开始之前,柯洁已经和master对弈了一局。那一局柯洁执黑,master执白。柯洁当时被戏称为白棋“让天下一先”,而黑棋对于柯洁来说相对不那么拿手。对局中,柯洁“先捞后洗”各种试探master,然而master稳到不行,柯洁的所有战术全不奏效。master没有给对手一丝机会,最后极其稳健的收官到了1目半胜。看起来赢得不多,但实际上是master为了保持胜率舍弃了目数。柯洁的应对虽然也十分的精彩,但确实没有一点翻盘的机会。

随后的第二盘棋,震惊了全世界……

人机博弈续:国、中、围三棋人机巅峰战 32%title%
(柯洁VSAlpho·master第二局全局谱)

整局棋大致可以分为三个阶段,前五十几手为第一阶段,至一百手为第二阶段。一百手至结束为第三阶段。

人机博弈续:国、中、围三棋人机巅峰战 33%title%
(第一阶段棋谱)

首先是第一阶段:第二局棋一开始,柯洁与master黑白互换,柯洁拿到了自己擅长的白棋。双方在布局阶段的前4手,柯洁首先选择了mater在第一局时候的布局。然后master也同样选择了柯洁第一局的布局应对:1、3小目配三三开局。这是一个很有趣的现象,因为在此之前,master通常都会选择当下最流行简明的布局定式,并不会去模仿对手的行棋风格。

人机博弈续:国、中、围三棋人机巅峰战 34%title%
(开场布局)

随后黑5、白6各自强挂小目防止守角,这里柯洁的落子针锋相对,有意试探对方。随后黑7、白8选择侧小飞——这是一个相对松缓的定式:看起来像是日本围棋巅峰时代的常见对局风格:开局不急不忙,后发制人,流水不争先。然而实际上,双方背后蕴藏的杀机令人胆寒。随后黑11靠了上去,白12、黑13互扳,白14打吃,黑15粘。这里一连串的对峙双方各种蜻蜓点水般的试探,到黑19,master直接贴到了四线,这是一步相当凶猛的棋,黑棋打算直接围杀白棋。

而紧接着在白20的时候,柯洁下出了开天辟地的“二路点”。这个白20的“二路点”与黑19的“四路贴”可谓以硬碰硬。二路点一边打算反围杀黑棋的阵地,同时为以后二三路的延展做准备。如果左右两边的黑棋试图连络,则白棋便有了阻断的力量。一旦白棋成功,黑棋两边不活,黑棋的战斗将会难以为继。

于是,master也是以强搏强毫不退让,黑21手直接跳在三路,反手压制白棋。柯洁也毫不示弱,白22爬了出去。这一路黑白棋互相贴身肉搏,倘若黑棋被带了节奏,白棋在5手之后,还有一个反身“断”的手段打破黑棋的连络。如果白棋成功,则能收获巨大实地,黑棋会腹背受敌。

随后黑23反手断在了R16的点上,破坏了白棋的阵地,使得之前白棋预想的战术化为了泡影。一旦白棋右上角阵地不稳,那么在二三路上与黑棋的搏杀就没有了条件。于是柯洁在白24的时侯吃在了S16,阻挠黑棋的行动。这一手增加了后方白棋阵地的眼位,但随后黑25跳到了K17的位置、这两步遥相呼应的棋令当时研究室里的众多顶级职业棋手大吃一惊。因为黑棋的这两手,直接在白棋阵地的外围形成了一个隐形包围圈,之前白棋的全部战略都失去了意义。因为在搏杀之后,即使白棋能活,外围也尽是“漏洞”,黑棋可以随意进攻。

于是柯洁在白26的时侯,下在了N17的位置,这是一招“试应手”。柯洁将棋形的选择难题抛给了master。随后黑27、白28和黑29三手棋之后,右上角的战斗暂告一段落。柯洁在这一段的战斗应对可以用“叹为观止”来形容。谷歌团队事后表示,这一段,柯洁的应对手段之强悍,几乎与Alpho·master不相上下——换言之,如果Alpho·master来代替柯洁下这一段,master也会做出和柯洁完全一样的应对。部分职业棋手表示,柯洁与mater在这里的攻防转换,已经开辟出了一个全新的棋路定式,后来人们将之称为:“柯洁——master定式”。

人机博弈续:国、中、围三棋人机巅峰战 35%title%

白30手时,柯洁主动停止了右上角的缠斗,保留了O18位置的“断点”,转而在下路L4的位置拉长战线。在围棋中有一句俗语,叫:“金角银边草肚皮”。顾名思义,先人总结围棋的经验认为:四角的争夺对整个棋局是最为重要的,四边次之。然而在这一局棋中,这个过去的思维定势似乎被打破了。无论是master还是柯洁,都不再对任何位置做先后划分,而是全盘考虑。边、角、中腹之间的关系变得平等。这是AI时代人类对于围棋的全新改观。

随着柯洁拉长战线,master紧随其后,黑31在下方J3点位逼住白棋。白32打入F4点位,想要断开C3和J3两颗黑子的连络。黑棋随后在D6位置屯兵,准备在左下角建立阵地与白棋对峙。之后白34选择“飞振”J5点位,联络自身。然而这一手棋并不够紧逼黑棋,白棋联络自身缓了一步,使得黑棋没有了压力,不需要再在下方与白棋抢先手。随即黑35逼在了左上边的C12位置,目的在于联络全盘,而柯洁立刻白36打进了C5位置。

事后谷歌团队表示,从黑31手开始一直到白38。master一直在试图联络全盘子力。但是柯洁始终与master贴身肉搏,打散了整个棋局。至白40,全盘没有一块固定的活棋。棋盘上,黑白棋互相对峙,至少有六个区域的黑白棋有对杀的阵势。可以说,柯洁将围棋的“乱战”发挥到了极致。他的思路也是有道理的,这是因为围棋程序中使用的蒙特卡洛算法有一个弱点,那就是强逻辑的缺失。

人机博弈续:国、中、围三棋人机巅峰战 36%title%
(双方纠缠势力图)

接着黑41抢占了F6的要点,这个位置,黑棋对C8位置的白棋产生了巨大的压力,如果黑棋成功包围,就能在左侧形成一个巨大的阵地,反过来压制下方的白棋。柯洁随后白42落点D7、白44落点D9两处,一边加固自己左侧孤棋的阵地,同时对左上方和左下方的黑棋形成压制之势。黑45、白45、黑47随即开始在下方贴身短打。白48、黑49在K3和L2的位置落下。随后白50、黑51双方开始在下方二路以死相拼。

黑53自挤一手,令当时的众多职业棋手都感到不解,因为这一手表面上看起来,黑棋减少了自身周围的“气孔”,看起来像是一着坏棋。但是在白54延展自身阵地的时候,黑55的在G4位置的一步靠,令众多人类职业棋手恍然大悟。就像之前在右上角一样,黑53与黑55的两手棋遥相呼应,这个次序直接逆转了黑棋的处境。因为两手棋令黑棋一边在白棋的包围下建立起阵地,同时还给白棋在J5位置留下了一个断点,这个位置成为了之后黑棋攻击白棋的弱点。如果白棋一个不小心,则下边就会被黑棋直接杀穿。

柯洁随后在白56立刻还以颜色,同样靠在了D3的位置。白棋这一步,与黑棋纠缠在了一起,左下角黑棋不敢再乱动,因为这一步,白棋也有类似的效果,与先前的白棋互相呼应,随时可以斩断黑棋的连络。如果黑棋不小心,不但无法发动攻势,还有可能被白棋反杀。

黑57联络自身,白58扳住左下角黑子,以此在左下角收获实地。随后黑59一手切断了白棋在下方的联系。到目前为止,双方在全局依然没有一块确定的活棋,全盘开战,互不相让,至此第一阶段结束。

人机博弈续:国、中、围三棋人机巅峰战 37%title%
(第二阶段棋谱)

接下来进入第二阶段,白60跳在L6,照应自身下方的阵地,黑棋与白棋在这里稍作纠缠,发现并没有便宜可以占,于是在黑63的时候,又回到了左下角的战场。黑棋在这里的动作是尝试加固自身在左下角的阵地,这证明柯洁的招数对于master来说确实非常具有压力,黑棋被白棋死死缠住,无法放开手脚进攻。

柯洁也许注意到了master在左下角的不安,白64与白66非常强硬的杀进了黑棋的阵线。双方互不相让,至白74黑75,双方在左下角形成了一个非常激烈的“劫争”。这里可以稍微解释一下,所谓的“劫争”是指:黑白双方都把对方的棋子围住,这种局面下,如果轮白下,可以吃掉一个黑子;如果轮黑下,同样可以吃掉一个白子。因为如此往复就形成循环无解,所以围棋规则禁止“同形重复”。根据规则规定“提”一子后,对方在可以回提的情况下不能马上回提,要先在别处下一着,待对方应一手之后再回提。

左下角的形成的“劫争”就如同一个隐藏的地雷,因为要消掉这个劫就要消耗掉两手棋,这会使得对手可以抢到两步先手。同时如果劫争失败,则相当于中间损失了一片空间。这个“劫争”直接成为了决定整盘棋最后胜败的关键。柯洁将这颗雷埋在了左下角黑棋的腹地中,并且将引线牢牢地攥在了自己的手里随时准备引爆。

随后白76手,又重新回到了右上角。由于谁都不敢先引爆“劫争”,双方就得不停的增加筹码。尤其柯洁注意到,master有意在避开“打劫”的情况,于是他更想借此获得优势。在之后的十几手,柯洁有意在右上角制造“劫”。左下角的“劫”成为了柯洁争取右上角优势的条件。一旦抢到先手,柯洁的利用“劫”可以不断地扩大自己的优势。而假如master要消去左下角的劫,那柯洁已经有了足够的步数鲸吞右上角的黑棋。这个优势一旦获得,那么全盘的主动权就都落在了白棋的手上。

master显然也识破了柯洁的意图,黑81手下在了L5的位置,这里靠近棋盘的中腹。黑棋开始和白棋在中间地带搏杀。由于左下角和右上角的劫缠在一起,使得master感觉自身的并没有获得明显优势,随后打算在中盘抢夺实地。柯洁自然不会放任,于是双方展开了对攻:白82、黑83、白84、黑85、白86。这几手棋,黑棋目的在于切断白棋左右之间的联络,而白棋也一边强化自身阵地,一边伺机包围黑棋。

之后master的黑87点在了N10的玄关,这一步,黑棋走畅了自身,同时对右下角的白棋形成了压制,还顺手逐渐向右上角靠拢。可见master依然想要联络起全盘子力。柯洁自然发现了这一点,白88镇压在了G10的点位上,一边镇压下方黑棋的“大龙”,一边想联络起自身的子力。同时柯洁也始终保持着左下角这个“劫”的威力,不让黑棋降低风险。

黑89点在了Q3的位置,威胁右下角白棋,同时捞取实地。然而由于柯洁保留着左下角的“劫”,使得黑棋的威胁效果没有那么大,因为白棋随时可以利用这个“劫”来争夺先手。白90随后落在了Q2的位置,柯洁明白master在尽力避免“打劫”,于是在右下角试图建立“劫”,誓要与黑棋决一死战。

柯洁的威胁显然是有效果的,一直到白98手,利用“劫”的威胁,右下角的白棋不但突破了黑棋的包围,更是反过来将M9至M4一路的黑棋大龙围困了起来。至此,整个棋盘上,黑白双方各形成了五条“大龙”,十条“龙”在整个棋盘上扭成一团。(围棋中“大龙”一般指在棋局上尚未获得安定,可能受到对方攻击、威胁的整块棋子

在第二阶段,柯洁与master互不相让,形成了全盘“打劫”,左下角更是形成了影响全盘的“天下大劫”。而这天下大劫的引爆直接决定了整盘棋最后的胜负。到第100手,柯洁正式引爆了“天下大劫”,最后的决战开始了。

一直到这里,柯洁始终与master势均力敌,这是从来没有发生过的情况。在之前的60局网棋里,大多数对手在前面几十手都已经落入了下风。谷歌团队在后台表示,柯洁显然逼出了master的极限,至第100手,master判断柯洁依然保有百分之50的胜率。可以说,柯洁在这一局棋前一百手的表现,已经迈入了人类棋道的最高峰。

人机博弈续:国、中、围三棋人机巅峰战 38%title%
(第三阶段棋谱)

棋局进入第三阶段,柯洁在第100手率先引爆“天下大劫”,誓要与master一拼生死。然而事后我们都已经知道了,这里是柯洁失败的开始。但真正的失败手并不在此,黑101手在左下角应“劫”,白102随即来到右下角打吃继续制造“劫”。可以说柯洁在下方两个角构思的“劫争”战术是极为精妙的,这一方面是在棋局上引发乱战——多个点位都在“对杀”,另一方面,两个遥遥相望的“劫”互相呼应,可以轮番抢先手。

黑103手只能硬着头皮先消掉右下角白棋制造的“劫”,否则两边遥相呼应,白棋只占便宜不吃亏。接着白104继续在左下角“打劫”抢先手。黑105应对了一手,随即白106又点到了O8位置,想要把右下角白棋延伸出来,切断黑棋。黑107跟着应对,点在了M9延长自身,阻挡白棋。随后白108又在N5打吃黑棋。到目前为止,柯洁构思的“打劫”乱战战术依然非常有效,完全牵制住了黑棋,master几乎疲于应对柯洁的进攻。

到白110的时候,柯洁感觉自己几乎已经看到了胜机。因为这一手点在了O10位置,右下角的白棋攻势锋芒毕露,右下角的黑棋已经被一分为二无法联络,而左下角的“劫”牵制着黑棋无法做出有利反击。同时右下角和右上角的白棋近在咫尺。

黑111压在了O11的位置,试图阻断白棋。白112随后在P9位置巩固自身阵地,这个位置的落子,给白棋之后留下了诸多后续手段。因为黑棋的先手来不及阻断白棋的突围。如果黑棋求自保,则白棋就来得及与右上角的阵地取得联系。而如果黑棋选择对杀,白棋丝毫不惧——同时依然是左下角的“天下大劫”威胁着黑棋。而右上角的战斗也还没有分胜负——柯洁在二十几手点出去的时候就保留了右上角的缠斗。现在一但白棋增援到达,右上角开盘的战斗,黑棋会立刻战败。也就是说柯洁给master制造了一个两难的选择,而无论黑棋选择哪一个,白棋都会大占上风。

然而master的应对也令人惊愕,黑113回到了右上角的战斗,故意不理白棋的威胁,让了一步先手。柯洁自然没有放过的道理,白114断在了N11,准备撕开黑棋的封锁。黑115随后打吃在M11试图围杀白棋。柯洁白116应了一手。下到这里的时候,出现了一个名场面:柯洁身体前倾,捂着胸口。因为所有人都看到,白棋的局势大有可为。

然而紧接着,master尽显自身强悍的实力:黑117打吃一步,逼白棋连络自身,然后黑119并在了L11的点位。这一步走出来,大大消减了白棋先前的优势。因为在这里,黑棋对中腹地带的白棋形成了隐隐的包围之势。如果白棋继续连络自身,那么黑棋就能在中央地带获得巨大实地,白棋的连络和左下角的“劫争”威胁全被消除。

人机博弈续:国、中、围三棋人机巅峰战 39%title%
(终局棋谱)

柯洁也反应了过来,白120在J10的位置联络自身在中腹地带的阵地。但这一下,master就抢到了先机,黑121跳在M13位置上。白棋自身尚未完全连络,黑棋借这一步先手,就打断了白棋的进程。右侧一代白棋连络的威胁已经被消除了。柯洁依然保留着左下角的“天下大劫”没有用来抢先手,而是选择在右侧区域与master定型。至黑127手落在Q9位置,白棋在右侧对黑棋的威胁基本被消除了,甚至反过来右下角还被黑棋包围了。

柯洁在此陷入了沉思,经过刚才一轮的战斗,白起先前的优势已经所剩无几。最终柯洁在白128手决定引爆“天下大劫”。然而不幸的是,柯洁的失败也从这里开始。事后柯洁表示,自己在左下角对“劫财”的计算出现了失误。黑棋在这里一共有三个“劫”,两明一暗,柯洁没有看到隐蔽的第三个“劫”。

从白128到白136,柯洁开始和master进行“劫争”。但是由于漏算,最终白棋失败。黑137手,master消除了左下角的“劫”。至此,黑棋彻底掌控了整盘棋的优势,白棋已经没有一点机会了。柯洁当时也已经意识到了这一点,在左下角“劫争”失败之后,知道自己已经彻底没有了机会。

之后的几手,master终于回到了自己最喜欢的简化定型模式。柯洁眼见胜利无望,随后几手稍微应付了一下,至黑155手,柯洁投子认输。

人机博弈续:国、中、围三棋人机巅峰战 40%title%

五:一些杂谈和个人感想

写到此,笔者感动不已:不为人类棋手们悲壮的抗争、不为AI对人类碾压的悲观未来。而是真切地感受到了:人类确实很伟大。当然抛开这些感性的描述,还是有别的值得一聊的地方。首先,是人工智能的主题,本文也确实是引申自《GEB之大成阅读笔记及杂谈》系列。棋类游戏作为智力游戏的代表,一直都是人工智能研发方面非常具有参考性的一个子门类。

计算机下棋,那么当中有一个转换过程——说白了一切问题都转换为计算问题,才能在计算机上运行——而计算确实是智能的一部分。棋类游戏的本质,其实可以转为理解成两边争步数的游戏。换言之谁的步数更多谁赢——因为双方是回合制轮流下棋,赢的比输的永远要多一步。从计算的角度来看,这个规则可以视为所有棋类游戏的一个核心。而在此基础之上,才是更进一步的不同棋子的规则,来看看不同的基本规则会导致那些不同的整体局面,甚至于整个评估概念都不一样了:比如围棋和象棋的差别。

围棋显然棋盘更大,但是棋子种类少很少,规则也非常简单——而这恰恰演变出了极为复杂的棋局演变过程;象棋(包括国际象棋、将棋)正好与之相对,棋盘稍小,棋子种类更多,行棋规则稍微复杂些——这一定程度上反倒制约了象棋局面的复杂程度。象棋中不同棋子对于争取步数有不同的效果:争取到的步数越多,棋子威力越大,对局面的影响也越大,所以车马炮被视为“大子”,小兵是“小子”。而围棋的棋子对于步数的争夺基本是一,但是局面上的自由度很高(可放任一点)。所以可以构成极其复杂的连续演变。

其它棋类游戏包括:井字棋、军棋、斗兽棋、黑白棋、跳棋等等都是用(棋盘都更小一些,军棋和斗兽棋都遵循于大吃小的基本规则并且带有一定运气其属性——飞行棋规则更依赖随机)

这里还是要再提一下GEB中反复强调过很多遍的几个很重要的概念:层次、递归、组块化。棋类游戏从基本走子规则到开中残局的演变,正是这三个概念的展现:低层次的走子规则进行组块化,形成高层次的不同局面的演变——>而棋局的发展用树形图概括,但每个局面之间的连接是呈递归关系的。

这里必须要说,很多人以为计算机下棋的强大来自于暴力穷举,这是误会,同时即使象棋比围棋简单很多,但它的中局复杂程度,依然超过了目前最强计算机的穷举能力。来看看围棋,我们发现越是复杂的局面,越倾向于局面评估而不是单纯的暴力运算。这某种程度上也是“组块化”这个概念的展现;象棋也是一样,最明显的例子是中国象棋目前的“第一人”王天一。他对自己的评判是,自己并不是棋路计算的深远,而是对于局面的判断更精准。

虽然到今天,在纯对弈方面,计算机确实已经完全强于人类了,一方面是软硬件方面有了很大的提高,另一方面,软件的编程和算法对棋类游戏的局面分析更精确了。但是,有几方面误区显得提一下:首先是棋类游戏虽然作为智力游戏,确实可以视作人类智能的一个模型参考。但仅仅因为计算机下棋胜过人类而大呼人工智能要取代人类的……这种呼声里,有太多感性表达的不精确性……换个直白点的说法:完全没必要。

人机博弈续:国、中、围三棋人机巅峰战 41%title%

ai程序的算度确实强悍,但并不代表下赢了人就有了智能——远远不到,它依然只是计算,仅仅是复杂一些。很多人把计算机的计算强度视为超越人脑的依据,这其实是对于智能这个概念粗暴简陋的理解。计算机的计算能力只是工具,就好比锤子之于拳头,如果锤子都没有拳头硬,其意义何在?同理,计算机也是一样,如果到今天它的计算能力要是还比不过人脑,那才是可悲的——白研究了那么久。

同时,棋类游戏里,计算机可以战胜人类也并不代表这个棋类游戏的终结。相反,它反而开创了全新的局面。以中国象棋为例,ai程序下出了很多前所未有的深算度棋招,这是过去棋谱里都不曾想到过的局面。而以此为依据进行学习,也把职业棋手的水平提升到了前所未有的层次;而对于人类来说,棋类游戏本身存在的意义也不仅仅在于输赢,而是与之关联到很多。这也是为什么得出:“计算机下赢棋并不代表拥有智能”这个结论的另一个原因。

来看看中国象棋的例子:象棋古谱中总结了两个规律:“切忌一子多动”和“宁失一子不失一先”。但有趣的是,这两个棋理,在一些情况下是互相冲突的。尤其软件时代到来之后,后者的理念似乎更进一步。在软件的思路中,胜败的概念被转换成了达到“最长步数”的概念。计算最优局面,找的始终是可以走“最长步数”的分支路径。所以这样看来,我们就会发现,软件下棋和人类下棋,二者在评估价值方面存在根本上的不同。这也就是为什么软件能走出很多一时之间难以理解,但又计算深远的“神招”。因为不是单纯的计算强大,更重要的一点在于其计算理念的把控。底层概念上的区别,比单纯的硬件计算差距更重要——人机大战中,人类对抗的条件,一直都是在“大局观”的判断方面,这一点不论象棋和围棋都是如此。

象棋和围棋都属于完全信息博弈:局面上的所有信息对对局双方都是完全公开的。(不完全信息博弈比如军棋之类的……)这里就有一个很有意思的现象:在完全信息博弈里,参与者反而会出现“选择性失明”——也就是看漏,走漏。这里的“失明”一般来自两个方面,一个是参与者自身实际上无法掌握全局信息,即便局面信息完全是公开的——人机博弈就是很典型的例子,人类和计算机的差别在于,人类自身状态导致其抓取的局面信息不是恒定的,而计算机获取的信息是恒定的,当然计算机也并没有掌握全部信息,其掌握程度视程序和硬件而定——所以AI下棋也能分输赢。(象棋里更多是和棋)

另一个则是对方的“引导”,导致对手选择性失明——这个差距和前面也有关系,也就是对弈双方对于局面的理解程度,理解越深的人掌握的信息越接近“完全”。同时这里可以引出一个很有意思的讨论点——人类智能对于大量信息的接收,往往不是照单全收的,而是会进行提炼和总结,进行有效归纳。但有时候这种有效归纳又会导致信息接收不完全。组块化的接受信息其实也是为了更高效率的接受更多信息,但同时效率也降低了信息掌握的完全度——就好像又进入了悖论一样,很有意思。

对于AI带来的种种,个人角度来说,我看到的更多还是积极的东西。但前提是,人们需要摆正自己的心态:AI对人类的积极意义在于,其可以帮助人类自身的提高。

就以我自己看的最多的棋类AI来举例。三棋现在都可以划分出前AI和后AI时代了,人类顶尖棋手们,跨越了这个时代分野之后,竞技能力的提升是有目共睹的。在有了AI进行辅助训练之后,人类棋手的平均水平和上限都获得了极大的提升。以中国象棋目前等级分第一的王天一为例,他的个人等级分一度达到过2800分。而根据评估,目前的象棋软件的起步水平,也差不多在这个分数往上一些。也就是说王天一作为“人类第一”已经摸到了AI下棋的门槛了。

除此之外,众多一线的顶尖棋手,在一定的条件之下(软件让先、限制计算深度),也可以和软件互相较量。由此可见人类的进步空间是确实存在的,所以AI在棋类竞技领域所起到的积极影响和作用,是不是具有一定的参考性,可以推广到其他领域呢?

当然有正也有反,AI的出现带来的也并不都是积极的意义。可是仔细想想,那些负面的问题真的来自AI本身没?还是说其实真正值得担忧的并不是AI本身,而是人们对于AI的滥用和过度依赖呢?——比如依靠AI的廉价劳动力,大量生产粗制滥造的作品冲击市场。比如之前多次发生的,在比赛中使用AI作弊等等丑闻。这些实际应用方面的问题,可能才是真正值得关心的问题,而不是那种虚无缥缈的“AI统治的未来”。但这些问题归根结底,还是人类自己的问题……

人机博弈续:国、中、围三棋人机巅峰战 42%title%

六:后记

本文从笔者有想法,一直到今天完成。前前后后差不多快有三年的时间了。总算是了解了一个心愿,也算是给机核在2023年的一篇年终献礼——虽然很有可能没什么人能看到了。

因为这篇投稿,对笔者自身的影响很大——最明显的地方在于,笔者为了动笔这篇内容,硬是从过去中国象棋随便下着玩,进阶到了初级入门爱好者的水平。而之所以选择练中国象棋的原因也很简单;围棋太复杂了……

在这里要感谢猫毛卯茂老师,是他的鼓励让笔者坚持到了现在。但同时笔者也想对他道歉;有鉴于文章区现状,很可能他一直让笔者写的中国象棋系列文章要坑掉了,很对不起猫毛卯茂老师的鼓励和期待。

同样有鉴于现状,这样性质的投稿,也许可能是最后一篇了(不好说)。所以笔者这里厚颜无耻的恳请看到这里的朋友,在评论区留下一个脚印,随便什么都行,也算是对笔者莫大的安慰了。在此谢过各位朋友,谢谢了!。

分享到:

评论已关闭