作为一名程序员棋迷,且研究生方向是人工智能,对于计算机围棋算法也是关注已久,所以对于AlphaGo也是持续关注。然而,AlphaGo的热度已经消退良久,为何此时才写?主要是因为当时思绪繁杂,且带有强烈的感情色彩(不愿承认围棋被计算机打败),所以当时匆匆记下思绪。此后通过与好友交谈,听Podcast,阅读相关文章,逐渐沉淀,遂成此文。本文将记录下自己对于AlphaGo的看法,其中人工智能及深度学习领域的探讨将另开一篇。

起源

最早接触围棋,是从父亲的两个纸盒开始,里面密密麻麻放着如同扣子般的塑料片与一张画着格格的塑料纸。这是父亲大学时所买,当时正值中日围棋擂台赛开战。虽然那两个纸盒一直是我的玩物,但是我最早学会的棋类(除去五子棋,跳棋等)却是是象棋。如今尤记为各种规则头疼,尤其不能理解马蹩腿的规则。高中时,自己又自学国际象棋,却被自己教会的同学瞬间击败,也不齿于学习王车易位这种蹩脚技巧。当是时,“石佛”李昌镐横空出世,深蓝击败国际象棋大师。围棋是三大棋类中唯一没有被计算机所击败的。于是乎,自己理所当然的转向围棋,开始了棋迷之旅。

那时期期定《围棋天地》,关注着古力,周鹤洋等围棋新锐,学习着围棋文化。觉得围棋博大精深,肯定不会被计算机所打败。碍于学业生活所迫,棋力一直在4k-1k间徘徊,偶尔1d,完全取决于那段时间打多少棋谱以及做多少死活。同时还兼任了百度围棋吧的吧主,期间所写文章请移步此处

读研期间,计算机围棋棋力已达4d,在KGS上可以看到Zen等当时最先见的围棋程序。然而就算是Zen,在与职业大师下棋时,仍被让四子还无法取胜。当时认为至少还得10-20年,计算机方可在围棋上与人类持平,要超越人类可能还得10-20年。与此同时,自己也研究了蒙特卡洛算法,单从算法本身来看,需要打败人类所需的计算量也是惊人的,所以对人类整体还是乐观的。

AlphaGo袭来

2016年初,刚刚听说AlphaGo,认为只是个Zen的升级版,并不寄予太大期望,最多也就是从让四子升级到让两子的水平。网上普遍对计算机围棋程序的感觉就是:

  1. 官子基本不出错,当棋盘越来越小,计算机基本可以不失误。
  2. 大局观差,在布局阶段选点差强人意。
  3. 棋感差,在对杀大龙时易出现莫名其妙的走法。
  4. 打劫黑洞,在分析劫的价值时,总是错误的估计为劫本身的价值。
  5. 局势分析,在边界不明了时,无法正确的分析棋局的形势。

但是战胜欧洲冠军的消息还是让人一惊,至少证明AlphaGo的水平已经进入职业级别。然而对围棋了解的人都知道,九段让初段2-4子也是可能的,所以还满期待它与世界顶尖九段一战。

随后就是与李世石的决战,当时是一心认为李世石会赢的。然而同时又有一丝顾虑,李世石已过巅峰时代,是否能代表人类(已经开始找台阶下了)。但这一丝的顾虑,也被自己的盲目自信以及自认为丰富的人工智能知识所打散。结果李世石对AlphaGo,1:4,“打脸”打得很疼。从此也认识到深度学习的力量(Deep Learning)。

即便如此,仍然认为人类不可能如此轻易的被计算机打败,世界第一的柯洁不是还没出战么。抱着这么一丁点希望,一直关注着AlphaGo的动态和进展。

此后网上是一片人工智能的热潮,悲观者认为人类终将被人工智能取代,乐观者认为人类迎来了又一次革命。在我看来,人类不会被计算机打败,毕竟是人创造的机器。同时,网络上不少分析指出,打劫或许是唯一能破除计算机算法的法门。有人甚至建议,在与AlphaGo下棋时,争取造劫。柯洁也是信誓旦旦要与AlphaGo一决雌雄。

紧接着,春节期间, 一个名叫Master的棋手在弈城上横扫中日韩60名职业棋手,其中也包括柯洁。后来方知Master就是AlphaGo的升级版。但对于柯洁的落败仍归咎于他的生病,或许在他状态最佳的时候,还是能有胜算的。此时人类棋手只需能战胜计算机一局,就可以满足了。

然而就在上个月,最后残存的希望也破灭了,世界围棋排名第一的柯洁0:3负于AlphaGo 2.0。无话可说,一个劫争都没有。AlphaGo近乎神一样的存在,以后可能是人类棋手被让几子才能与其抗争。

反思

一切都犹如做过山车一般,人类在围棋中的不可一世,到一丝希望,最后彻底灰飞烟灭。人工智能已经在认为最不能战胜人类的地方,将人类彻底击败。

多种声音顿时混杂于网络之上,有灭世论,新纪元论(人类进入新的时代),也有不服论(认为在扑克方面机器还未战胜人类 【就在写此文时,人工智能已经在德州扑克中战胜了人类高手】),等等。

然而为什么我们以前认为计算机无法完成的难题,在短短几年间一一克服了呢?

  • 计算机无棋感

首先棋感这个是很主观的说法,无法确切的定义,同一步棋在胜局里就是棋感好,在负局里就是棋感差。

其次棋感是为了感觉棋盘上的“味道”。“味道”也很主观,什么叫好,什么叫坏呢?

通过Master 60局快棋胜局来开,好多棋理中认为是坏棋,但最后结果还不差,是否就说明其已经有棋感了呢?总之,AlphaGo颠覆了棋理中那些无法解释就用棋感味道解释的地方,让人们了解到其实棋感不好的棋只是计算力不够而已。

  • 无法正确估算形势

在棋盘上还只是到中盘,地还没有围实的时候,形势的估判能力往往是区别新手和高手的标准。用过围棋软件的都知道,其形势的估判有时候会很莫名其妙,尤其是在有劫争和假眼的情况下,过分乐观或者过分悲观。从而造成下法上激进或保守。

但AlphaGo似乎并没有此问题,从始至终都很平稳。赢也只赢取半目即可。除了中盘胜,其胜局所赢的目数很少。可见只要AlphaGo没有投子认负,那就证明形势仍是看优的。

  • 劫争

弱点如果无法克服,最好的办法就是避开它。AlphaGo似乎也深谙此道,体现了扬长避短。对于职业棋手的故意造劫,总是设法避开。人类最后战胜机器的计谋也无法得逞。

以前一切对于计算机的认识悉数打破,更可怕的是,就连创造出AlphaGo的专家也无法预知AlphaGo下一步棋要走哪里。

综上

现在我已经彻底折服于人工智能的力量之下,反而觉得自己所学的都是些皮毛。

围棋古称手谈,意为通过下棋可以了解对方的性情为人,就如两人交谈一般。并且现在人工智能的模型(尤其是神经网络)无法推导,或许通过和围棋高手的对弈,能够为我们提供一个通道来窥探人工智能的想法,总结出人工智能的人工“逻辑”。尤其通过对其违背棋理的招数的分析,“对冲”出机器的思维。因为每一个棋理的背后都有丰富的理论做支撑,而机器所走的一步也必是其认为更好的一招,即棋理的逆命题也成立,或许可能逆推出其思路。

欧美历史上一直落后于东方,至少在GDP上大部分时间是落后于中国。近现代逆袭利用科技征服了世界,但东方文化的神秘,一直让其无法理解。更别说学习围棋并成为大师的外国人了。但他们扬长避短,通过科技战胜了他们如何学都学不会的围棋。说来也讽刺,同样以科技崛起的国家却没能先人一步将祖先留下的秘密解开。

基于以上两点,甚至萌生出读博再深造的想法。以了解AI思路为出发点,帮助人类理解深度学习的逻辑。然而理想很丰满,现实很骨感,读博的计划在前思后量中也作罢了。

网络上在这次比赛过后出现了不少恐惧AI的声音。或许我们并不是怕人工智能取代我们,而是我们无法理解人工智能到底在想什么。