看AlphaGo下棋,心好累

 

不同于去年和李世石的比赛,去年的比赛结果加上今年年初Master的60连胜,这次的比赛基本没有悬念。Alph...



不同于去年和李世石的比赛,去年的比赛结果加上今年年初Master的60连胜,这次的比赛基本没有悬念。

AlphaGo流传于世的棋谱很少。赛后这次DeepMind公开了50局AlphaGo自我对弈的棋局。看了一些,只能用震惊形容,这绝对不是人类的下法,相当于这次柯洁第二局比赛的放大版。

没有定式,很多棋横空而来,但看起来模模糊糊觉得有道理;无数次的脱先,你下我不一定要应;大量的弃子,但都是留有味道;开始看不懂,后来看来,呈现了可怕的大局观,每步棋似乎都留有后手;棋与棋之间大量的对杀和转换,都不知道是怎么出来的;开始看棋,只有一种感觉,心好累,完全猜不出会下在哪里,完全不会做形势判断,完全不知道棋局后来会如何演化。。。

某种意义上,的确如Deepmind的blog中所说,AlphaGo开启了人类对于围棋的更深认知。围棋是极其复杂的游戏,结合了大局观和拼杀,人类为了避免复杂,一方面产生了很多的定式,一方面在对弈过程中,也会有意无意地避免很多过于复杂的算法,几千年下来,其实是限制了人类的认知。AlphaGo以及一系列之后的AI出现以后,看到了新的可能之后,人类会打破自己的枷锁,我相信在之后几年内,能否战胜AlphaGo不一定,但人类围棋水平一定会有一个非常大的提升。

为什么AlphaGo这么强?一些自己YY的思考(新的论文未发表,基于上一版论文):

  1. CNN的原理保证了它不会局限在局部,也不会受前一步棋太多的影响,永远都是全局来看,这点人类可以学习
  2. 选子网络其实是学习人类,培养直觉,但是也有局限也就是必须要有数据,据说最新这一代AlphaGo完全不需要人类棋谱,使得通用性更强也避免了人类一些错误,我猜是基于第一代AlphaGo才不需要人类棋谱;
  3. 策略网络的探索,这是最核心的部分了,能减少浪费地算多广多深,依赖于此。有些好奇,人类永远都会在脑子中虚拟推演所以只需要小数据就可以学习。现在这样的策略网路,是逼近了人类的方法了吗?
  4. 强化学习和自我对弈,人类也是用同样的方法来学习,这是超越9段之路
  5. 无情感无波动。这样是否少了很多乐趣和风格?我不知道,理论上选最优算法,至少很多棋会显示出“风格”,而且或许在策略网络中可以调节。人类可以做到故意输,虽然DeepMind现在还不行,但觉得调整一下应该可以。。
说起来时间也不短了,1997年深蓝在国际象棋战胜人类最强者,20年后的

2007年AI在围棋上战胜了人类。这次又有所不同:即使看了深蓝的论文,普通人也无法做出一个深蓝,太多复杂的非通用逻辑规则;而看了AlphaGo的论文,结合足够的数据和算力,普通人也有可能训练出一个围棋圣手。这是通用算法的胜利。

新的时代到来了,或许开始心会很累,但是这个世界,又开了一扇新的窗口。


    关注 丰言丰语


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册