AlphaGoVS李世石

↑↑点上面蓝色小字 | 关注↑↑

我们是中科院主管、科学出版社主办，与日本知名科普杂志Newton版权合作的一本综合性科普月刊。

【如需转载，请在后台留下您的公众号，

获得授权后方可转载】

这几天，AlphaGo，Google公司开发的最尖端的计算机程序，正在和围棋世界冠军李世石对决。为了更好滴观看比赛，这里有你应该知道的5个小知识！
1Go是啥？Go，其实就是我们所熟知的围棋啦，早在3000年前起源于中国，是中国古代知识分子修身养性的一项必修课，位列“琴棋书画”之一。之所以把“围棋”称作“Go”，主要是参考了日语“碁”的发音。在围棋漫长的发展历史中，规则的变化始终不大，并在东亚地区渐渐流行开来。虽然围棋运动在西方并不是特别流行，但是在中国、韩国、日本，经常会看见一群人挤成一团观战，而对弈双方手执黑白棋子进行“厮杀”。

围棋在西方苦苦挣扎多年却始终没有流行起来。Ben Lockhart，今年22岁，很小就开始学习围棋了。四年前，Ben特地搬到了韩国全职学习围棋。对此次的人机大战，小伙子表示：“以前真没几个人知道围棋，大赛之后人们至少听说过了。” 围棋没有在西方流行开来，一个原因是没有历史根基。另外，观众看比赛的过程太长了，如果不太熟悉游戏，根本看不出谁输谁赢。就像9号的那场比赛，几个小时后，几乎所有的记者都靠在椅子上玩起了手机。
2围棋怎么玩呢？围棋是两个人的游戏，一人执黑子，另一人执白子。棋盘上画有19X19的网格。棋局开始时，棋盘上没有棋子。双方轮流在网格交叉点上落下一颗棋子。棋手需使用各种战术，一方面利用自己的棋子围成图案，在棋盘上占领更多的地盘，另一方面想方设法将对手的棋子围住吃掉，最终以所占领的地盘（即网格数）的多少定胜负。

▲围地吃子

3为什么围棋这么复杂啊？乍一看，围棋蛮简单的嘛！~不像国际象棋，围棋所有的棋子（只要同一个颜色）都一模一样，而且一旦落盘，就决不允许再移动。
虽然规则看起来简简单单，实则杀机暗藏，因为棋手实在有太多种方法来行棋。国际象棋开局时只有20种走法，而围棋起手时就有361（19X19）种落子选择。显然，比赛中围棋有上万亿种走法，比象棋要多太多了！

▲直观地对比一下国际象棋和围棋的复杂度

这些几乎无穷无尽的走法，使得棋手很难提前规划，并制定出一套详细的策略。想掌控比赛，意味着你要根据对手任何可能的走法随机应变。 AlphaGo的创始人Demis Hassabis也曾说过：围棋是人类发明的最深刻的游戏！相较于周密的计算，围棋更需要人的直觉与感觉。这也是为什么计算机很难下得好围棋的原因。
4为什么要和人工智能下围棋呢？想让计算机变成围棋高手，一直是人工智能领域的一大挑战！早在1997年，计算机就已经攻克了国际象棋，IBM的深蓝击败了世界冠军Garry Kasparov。围棋理所应当成了下一个，也是最后一个目标。

▲1997年纽约，深蓝与Garry Kasparov对弈

计算机可以在国际象棋和西洋跳棋的对决中击败人类的顶尖高手，但是掌握变幻莫测的围棋似乎还差些火候。但是去年10月，AlphaGo第一次击败了围棋职业选手，欧洲围棋冠军樊麾，比业内专家的预言还提早十几年。AlphaGo的精进棋艺也让人们见识到了计算机原来可以如此神速地掌握围棋技巧！ 5机器胜利意味着什么？AlphaGo在本月会与33岁的李世石在韩国大战5个回合（分别在三月9/10/12/13/15日），获胜者奖金高达100万美元。Google宣布如果AlphaGo能赢得比赛，奖金将用作慈善。
尽管AlphaGo刚刚击败了欧洲围棋冠军樊麾，但是“欧洲冠军”嘛……你懂得，也只是职业二段的围棋选手。因此，在开赛之前，李世石显得信心满满。但从目前已结束的两局结果来看，李世石预测的自己将以5:0或4:1取胜的情况是不可能出现了。其实，当3月9日AlphaGo首战告捷的时候，人工智能就已经开启了一个全新的时代。

历史性时刻：首战告捷

▲2016年首尔，AlphaGo与李世石的首场对决

比赛开始前，李世石向对手鞠躬，这是韩国的礼仪传统，以示对对手的尊敬。虽然，它的对手根本就看不见他。围棋项目的世界冠军看起来似乎有些紧张，喝了一小口水，终于落下了第一颗棋子。三个半小时过去后，历史被刷新了。AlphaGo赢了，震惊了所有的观赛者，标志着人工智能领域的新突破。 DeepMind团队（AlphaGo的开发团队）为程序植入了强化学习（reinforcementlearning）机制，也就是说，机器可以自己和自己下棋，并在反复的试验中建立起自己的神经网络。AlphaGo的核心是两种不同的神经网络：策略网络（policy network）和价值网络（value network）。
这两种神经网络协同合作，AlphaGo可以减少计算上的搜索空间，将近乎无穷的行棋选择经分析缩减至一个可控的范围，并能根据一步棋预判其在多步之后的影响。这和人类在下棋时的思考过程已经接近了，而并非像之前有些人想的那样：计算机不过是使用了穷举法，将所有的可能快速试了一遍而已。下面是DeepMind设计师Demis Hassabis对AlphaGo的简单介绍：

◆ ◆ ◆

其他观点

Andrew Okun，美国围棋协会会长，专程飞到韩国首尔观战。Andrew说：“自古以来，围棋都是人与人之间的较量，是一种磨练品格的游戏。但是AlphaGo，它不会累、不会健忘、也不会焦虑。” 也许是吧，AlphaGo没有人类的所谓的直觉，但同时，也不会有人类才有的焦躁与不安。
文章来源/The Guardian