人类围棋棋谱

看AlphaGo下棋，心好累

不同于去年和李世石的比赛，去年的比赛结果加上今年年初Master的60连胜，这次的比赛基本没有悬念。Alph...

不同于去年和李世石的比赛，去年的比赛结果加上今年年初Master的60连胜，这次的比赛基本没有悬念。

AlphaGo流传于世的棋谱很少。赛后这次DeepMind公开了50局AlphaGo自我对弈的棋局。看了一些，只能用震惊形容，这绝对不是人类的下法，相当于这次柯洁第二局比赛的放大版。

没有定式，很多棋横空而来，但看起来模模糊糊觉得有道理；无数次的脱先，你下我不一定要应；大量的弃子，但都是留有味道；开始看不懂，后来看来，呈现了可怕的大局观，每步棋似乎都留有后手；棋与棋之间大量的对杀和转换，都不知道是怎么出来的；开始看棋，只有一种感觉，心好累，完全猜不出会下在哪里，完全不会做形势判断，完全不知道棋局后来会如何演化。。。

某种意义上，的确如Deepmind的blog中所说，AlphaGo开启了人类对于围棋的更深认知。围棋是极其复杂的游戏，结合了大局观和拼杀，人类为了避免复杂，一方面产生了很多的定式，一方面在对弈过程中，也会有意无意地避免很多过于复杂的算法，几千年下来，其实是限制了人类的认知。AlphaGo以及一系列之后的AI出现以后，看到了新的可能之后，人类会打破自己的枷锁，我相信在之后几年内，能否战胜AlphaGo不一定，但人类围棋水平一定会有一个非常大的提升。

为什么AlphaGo这么强？一些自己YY的思考（新的论文未发表，基于上一版论文）：

CNN的原理保证了它不会局限在局部，也不会受前一步棋太多的影响，永远都是全局来看，这点人类可以学习
选子网络其实是学习人类，培养直觉，但是也有局限也就是必须要有数据，据说最新这一代AlphaGo完全不需要人类棋谱，使得通用性更强也避免了人类一些错误，我猜是基于第一代AlphaGo才不需要人类棋谱；
策略网络的探索，这是最核心的部分了，能减少浪费地算多广多深，依赖于此。有些好奇，人类永远都会在脑子中虚拟推演所以只需要小数据就可以学习。现在这样的策略网路，是逼近了人类的方法了吗？
强化学习和自我对弈，人类也是用同样的方法来学习，这是超越9段之路
无情感无波动。这样是否少了很多乐趣和风格？我不知道，理论上选最优算法，至少很多棋会显示出“风格”，而且或许在策略网络中可以调节。人类可以做到故意输，虽然DeepMind现在还不行，但觉得调整一下应该可以。。

说起来时间也不短了，1997年深蓝在国际象棋战胜人类最强者，20年后的

2007年AI在围棋上战胜了人类。这次又有所不同：即使看了深蓝的论文，普通人也无法做出一个深蓝，太多复杂的非通用逻辑规则；而看了AlphaGo的论文，结合足够的数据和算力，普通人也有可能训练出一个围棋圣手。这是通用算法的胜利。

新的时代到来了，或许开始心会很累，但是这个世界，又开了一扇新的窗口。

关注丰言丰语