【写在前面?/span>
2017q??3日,W二ơ“h机大战”火热开赛。去q曾大比分击败韩国选手李世乭的AlphaGoQ再度与柯洁{ؓ代表的中国顶棋手进行对弈。比赛采用中国规则,三番,无论输赢Q每?时Q??分钟ȝ。因为此前对战李世乭时AlphaGo表现Z强实力Q几乎以“碾压hcZ的方式取胜Q所以对于第二次人机大战Q众多业内h士觉得hcd望不大?/span>
dW一ơh机大战之前,搜狗CEO王小川曾在知乎发表评论,明确表示AlphaGo完胜李世乭。而对于这ơ比赛,他再ơ在知乎表达了自q态度Q“我们的x点不再是机器是否会赢——而是机器用什么姿势战胜hcR?/span>
王小川说QAlphaGo2.0?.0技术原理有着巨大不同Q更接近于hQ因此这ơ比赛的最大看Ҏ(gu)QAlphaGo2.0或许会频现“怪招”,完全颠覆人类对围的理解。AlphaGo告诉我们Q我们还有极大的发展I间Q而AlphaGo2.0告诉我们Q如果有合适的条gQ完全可能有其他的生命进化\径,以及更不一Lq化l果Q相当于重演一部进化史?/span>
5?3日,柯洁在比赛现场。东方IC ?/span>
以下为王川知乎全文Q?/span>
该来的终于来了?/span>
一q前AlphaGo发布Q看完论文后我就在知乎上发文预测机器会完胜hcR好些行业朋友不怿Qؓ此我收了很多“智商税”,之后微信发红包一直发到春节才发完。此外我q立了两个断aQ一个是Google很有可能再研发出AlphaGo 2.0Q摆脱“监督学习”,不再需要hcM围棋的历史数据,而是只通过“增强学习”,两台AlphaGo自我Ҏ(gu)学习如何下棋Qƈ辑ֈd造极的地步。从公开的资料判断,此言中了。这意味着什么呢Q又有什么看点呢Q?/span>
技术重大提升:?.0原理大不?更接q于?/span>
AlphaGo1.0 是y妙地混合了三U算法:蒙特卡洛树搜?监督学习+增强学习。其中蒙特卡z树搜烦是一U优化过的暴力计,?997q深蓝的暴力计算更聪明。而这里的监督学习Q是通过学习3000万步人类谱Q对六段以上职业手走棋规律q行模仿Q也是AlphaGo获得H破性进展的关键法。而增强学习作助,是两台AlphaGo从自我对战众中学习如何下,据?zhn)?gu)力提升有限?/span>
Ҏ(gu)公开资料推测Q此ơAlphaGo2.0的技术原理与之前有着巨大不同Q?/span>
1. 攑ּ了监督学习,没有再用人的3000万局谱q行训练。这本是AlphaGo最亮眼的算法,也是今天L机器学习不可避免的核心条Ӟ依赖于优质的数据Q在q个特定问题下就q么被再ơ突破了?/span>
2. 攑ּ了蒙特卡z树搜烦Q不再进行暴力计。理ZQ算法越W,p需要暴力计做补充。算法越聪明Q就可以大大减少暴力计算。从AlphaGo 2.0的“马甜yMaster的历史行为看Q走非常迅速,U在?0U钟p一步,如此速度很可能是攑ּ了暴力的计算?/span>
3. 极大地强化了增强学习的作用,之前敲边鼓的法Q正式成为扛把子d。想想看有多励志Q两台白痴机器,遵守走棋和获胜规则,从随开始日夜切,ȝl验Q不断批评和自我批评Q一周后l成大器?/span>
在这L法下,AlphaGo2.0对计资源开销极小Q把当前局输入经|络Q电(sh)流q,输出是最佳的走棋Ҏ(gu)。我猜测如此法下,有可能仅仅依靠一个GPU工作Q每一步棋消耗的能源接近人的大脑?/span>
比赛现场大屏q?/span>
最大看点: AlphaGo2.0 风完全q人类l验
今年q初QAlphaGo化nMasterq胜人类尖手60局。在围棋领域Q机器完胜已l变成公认的定论。这D很多人开始问Q这ơh机大战还有意义吗Q我们的x点不再是机器是否会赢——而是机器用什么姿势战胜hcR?/span>
AlphaGo学习?000万步人类谱Q走风gq似于h。在比赛现场Q偶有AlphaGo走棋和h的经验不W合Q就被评为“愚蠢”,只是在中盘之后发现机器渐渐局面占优最l获胜,Z自圆其说解读为“AlphaGo中盘逆{”,前两局莫过如此。第三局开始评长了教训,开始尊UAlphaGo为“阿老师”,有了ƣ赏和敬畏的心态。这带给围棋界很大的冲击Q以前大家认为正的东西Q其实是不正的。柯z曾l评仯Q“AlphaGo出现Q很多理论都被推,再看以前定式变得好笑Q亏那么多目׃再是两分。”hc通过数千q实战,ȝ了围理论,然后计算机告诉hc:q些全都是错的。现在在很多比赛上,人类手已经开始向机器学习Q模仿AlphaGo的下法,圣聂卫q也曾表C“理颠覆了”?/span>
而AlphaGo2.0q了机器对人模仿,走棋风格也将完全q人的定式。在与柯z的比赛中,会不断出现我们意想不到的走棋Q而且q些走棋在教U书中会被认为是低错误或者完全不可理喻,但凡一个正常的手都不会这么玩Q但凡一个新手这么玩都会被点拨这样不寏V而AlphaGo2.0会不断制造这L局面,关键他还是对的。可惛_专业手的心里会有多大的震撼Q不仅自p一辈子都没q么惌q么下棋Q整个围界都没有想q。会不会怀疑自qzMQ会不会反思两千年围棋的发展ؓ什么有q样的瓶颈?q有多少阔天空{着我们L索?可等不及我们L索,计算机就l出了终局的答案,多么惆怅?/span>
我们会|z乐道,AlphaGo是什么棋风。但可以q样推理Q但凡有派和风|p有局限性。只有当所有流z一看不出流z时候,才到达致高境界。AlphaGo 2.0便会是这么一台机器,没有风格Q稳如磐矟?/span>
可以惌q次与柯z的对弈Q能频现“怪招”,完全颠覆人类对围的理解——这会是比赛最大的看点。英勇的柯洁Q要解锁108U姿势来抉|了?/span>
2017人机大战的意义:重演一部进化史 重新认识智慧的边?/span>
2016q在AlphaGo和李世乭的对战后Qh工智能进入大众的视野Q我们开始重新思考机器和人的关系?/span>
围棋已经有两千多q的历史Q在漫长岁月的琢中Q围理Z断进化,到达了很高的水准QAlphaGo的获胜,我们大可以解M“青Z蓝”,毕竟是在人类围棋q化的主路径上又攀高峰?/span>
而AlphaGo2.0完全抛弃掉hc这两千q来q化的围经验,另寻他径Q仅凭两台机器自我对弈中学习和进化,最l不仅赶了人类q化的速度Q还发展Z套截然不同的下棋Ҏ(gu)Qƈ且更加接q完的状态,实现了对人类的碾压,重演了一部围的q化Ԍ而且得出了与q两千年来不同的q化l果?/span>
q会l我们什么启C?如果跛_围棋的规则,cL看地球生命的q化QhcL从原始的有机物,到单l胞(yu)开始逐步变成灵长cd物,q且发展其他一切生物的智慧。这条\径是唯一的么Qhcȝ生命形态和最的生命Ş态还有多大距?AlphaGo告诉我们Q我们还有极大的发展I间QAlphaGo2.0告诉我们Q如果有合适的条gQ完全可能有其他的生命进化\径,以及更不一Lq化l果?/span>
让我们欢gh的智慧造就了AlphaGoQ这也帮我们开了眼界,看到我们Ll的生命形态和智慧依然有遥q的距离?/span>
保持敬畏Q坚定前行,l得圆满?/span>