首先要说明,本人不会下围棋,对神经网络和人工智能也没有研究。所以本文不会讨论任何技术上的细节,更多是基于个人情怀和好奇心,对人狗大战以及由此引伸的人工智能发展前景问题做些浅显的讨论。本来是打算温习完攻壳后再写的,但今天李世石的惊天大逆转,让人按耐不住内心的激动而想要写点什么。同时,也希望有更多人加入到对人工智能和其他前沿科技的讨论中来,尤其是各位技术帝们就不要再金屋藏娇了,多出来给大家科普一下。当然,网站的灌水大业也需要诸位一道添砖加瓦。
近几日晚饭时一直在看The men who built America。该片着眼于南北战争后美国经济高速发展的时期,讲述了铁路大亨范德比尔特,石油大王洛克菲勒,钢铁巨头卡内基,金融巨富J.P.摩根和后起之秀汽车供应商福特,如何依赖敏锐的商业嗅觉,远见的卓识,很辣的行事作风与手段,以及对新兴科技的重视,使用和推广来改变美国,推动整个社会的发展。马克思说『资本主义来到世界上,从头到脚每一个汗毛孔都滴着肮脏的血』。不可否认,在那个法制不健全,人权意识淡薄和秩序混乱的时代,资本家为达目的,往往无所不用其极。撇开这些不谈,不论他们是出于对社会的责任感,对财富和权势的欲望还是纯粹的野心,他们确实影响和改变了那个时代。当然,个人更倾向于这是科技的胜利。火车的出现,促使范德比尔特变卖造船业的全部家产投身铁路建设。洛克菲勒面临来自电灯的挑战,在石油中发现了除煤油以外的『副产品』汽油最终转危为安。卡内基通过对新兴炼钢技术的推广,使之成为建筑业的重要材料。J.P.摩根不辜父亲的反对,毅然投资爱迪生的电气公司,推广电气化。福特作为第一个制造出普通人能够负担得起的汽车的供应商,为大众创造了新的需求,也彻底改变了公共交通的方式。一个多世纪过去了,我们又处在一个科技迅猛发展的时期。下一次科技革命会发生在什么领域?21世纪的人们又会走向何方?是一个值得深思的问题。个人还是蛮看好星际探索和人工智能的。
拐回来说说人工智能。最近一周,李世石(石头)和AlphaGo(阿花狗)的围棋大战已经刷爆了朋友圈和各大媒体头条。每天早上手机嗡嗡直响的时候,我就知道是比赛已经开始了。在讨论人狗大战前,我们先简单回顾下国际象棋版的人机大战。1997年五月,IBM设计的deep blue(深蓝)在game 6中用仅仅19步就迫使国际象棋世界冠军卡斯帕罗夫认输,并以大比分3.5:2.5战胜后者,成为了历史上第一台在正常思考时间内击败世界冠军传奇选手的人工智能机。前五局的结果分别是卡斯帕罗夫胜1:0,deep blue胜0:1,平0.5:0.5,平0.5:0.5和平0.5:0.5。值得一提的是,在三场平局中卡斯帕罗夫都是在开局占优的情况下最后被深蓝逼平的。更加有趣的是,根据wikipedia上的描述,比赛结束后,『Kasparov accused IBM of cheating and demanded a rematch. IBM refused and retired Deep Blue. 』对于作者这样不明真相的群众来说 这种花边新闻又为整件事增添了一丝神秘色彩。深蓝的算法似乎是基于神经网络,但读起来又好像有所不同。算法帝们可以出来解释下。
深蓝之战后,围棋似乎成为了人类智力世界里的最后一座堡垒。根据wikipedia上的描述『There is significant strategy involved in the game, and the number of possible games is vast (\(10^{761}\) compared, for example, to the estimated \(10^{120}\) possible in chess), displaying its complexity despite relatively simple rules. 』 我不太清楚这个761次方是怎么来的,361!比这个要高不少。不知道是不是有些对称性的考虑。wiki上该处的reference是个dead link,技术帝有兴趣的可以算算。
围棋的复杂性,决定了现有的计算设备是无法靠遍历所有路径来寻找最优解的。阿花狗是谷歌旗下的deep mind团队设计的围棋智能机。他主要依赖的是neural network算法。具体的我也不懂,就还是不要误人子弟了。有兴趣的可以去看C站的Neural Networks for Machine Learning课讲义,by Geoffrey Hinton。商业网站,我就不贴链接了。
时间回到今天,也就是2016的3月13日。我之所以要强调这个时间,是因为昨天石头刚刚度过他的结婚纪念日。而对笔者而言,更重要的是家妹昨天生日,在这里再次祝她生日快乐!好,言归正传。在大比分0:3落后,比赛总结果胜负已定的情况下,在外界一面倒地唱衰,围棋界风声鹤唳,职业高手们人人自危的情况下,石头迎来了关乎人类尊严之战的game 4。让人情不自禁地想起了那句『风萧萧兮易水寒,壮士一去兮不复返』。总的来说,在关乎人类尊严之战的game 4开始前,舆论的状态让人很容易联想到赤壁之战前夕,吴国内众文官大臣的反应。历史还真是让人耐人寻味。
时间倒回到一周前,职业选手们普遍认为阿花狗不足为惧。李世石本人也认为自己将以4:1或者5:0获胜,如不出现失误,将100%获胜。短短一周时间,舆论就出现了180度大转弯,像坐过山车一样,让人感慨高科技的步伐永远让人难以捉摸。回想几周前boston dynamics的人形机器人展示,同样让人震撼。这一切需要我们重新审视人工智能的发展前景和速度,作为科研工作者我们更需要思考它在科研领域的可能应用。我知道天文领域,已经有人尝试用neural network的方法从图像中搜寻恒星和星系。
最后回到game 4,回到比赛的胜负手,小李的第78手,又被大家称为神之一手。神之一手一出,阿花狗立刻混招连连。按照设计者的说法,阿花狗在应对78手时,判断自己的胜率有70%,也就是说阿花狗并没有意识到这一妙招。而直到第87手,阿花狗才发现形势不对,而自己的胜率也开始大幅下跌,并最终输掉了比赛。而石头也如愿以偿,实现了惊天大逆转和绝对大反击,捍卫了人类智商上的尊言。
抛开其他的不谈,我觉得今天的比赛告诉大家阿花狗还远未达到围棋之神的地步。既然没有到达神的地步,理论上就是可以战胜的。本次人机大战,不论最终战结果如何,对人工智能和围棋本身都是极大的推动。因为不仅人工智能需要进化,围棋本身或者说棋手们也是需要不断进化的。阿花狗的新式玩法正好为大家提供了新的参考资料和思路想法。
从第一局石头输掉比赛后,大家就开始探讨比赛的公平性。有人说,人的喜怒哀乐会影响状态的发挥而且人会失误。但今天我们看到阿花狗也会失误。人是有心态问题存在,但竞技比赛本身就要求选手不断调整好状态。还有人提到时间问题,觉得人应该有更多的时间,体力问题,觉得比赛的密度和强度对人来说可能太大,棋风的问题,觉得石头可能不是最适合和阿花狗对弈的选手。这些说得都有道理。不过,个人觉得对职业棋手而言最大的不利之处,在于信息的不对称性。孙子兵法曰:『知己知彼,百战不殆』。阿花狗本来就是按人类历来的棋谱训练出来的,对我们的各种流派套路自然很熟悉。而且很可能在自我对弈的过程中进一步形成了一套自己优化过的行棋策略。反观,职业选手们对阿花狗这个未知的对手显然一无所知。从赛前,棋手的各种反应就可以看出。从比赛前的不屑一顾到比赛时的大跌眼镜和舆论的180度大转弯,再到现在的绝地大反击。反映出人类棋手们对阿花狗的下法非常不熟悉。职业棋手们大多的判断还是依赖于几个月前,阿花狗和欧洲冠军的对局。而这些资料显然已经过时了。在竞技游戏中,这是非常致命的。就好比dota比赛中,有队伍在决赛中祭出了大招。那么对手如果应变能力不强的话,很可能束手无策。如果我们把阿花狗当作对等的对手来看待。现在阿花狗的表现,就像一个打法独特的后起之秀,需要大家慢慢研究适应。而这个钻研的过程,对人类棋手而言也是一种训练和进化。
然后,石头比赛输给阿花狗意味着什么?必然意味着人工智能的胜利,但与此同时是否也意味着人类的失败?我不觉得。时至今日,我们的纯计算速度已经早就被电脑抛到了十万八千里外,奥运会上的百米飞人们也早就跑不过汽车了,更别提火车,飞机和火箭了。单纯和单一技术指标的比较变得毫无意义了。输给阿花狗,我不觉得就说明电脑比人类更『聪明』。因为,你不是在与一个阿花狗较量,而是在与人类围棋史上的无数前辈在对战,更是和人类几千年来智慧的结晶在较量。即便阿花狗赢了,个人觉得也没有什么可怕的。或者说,笔者觉得人类的败北只是时间问题。只是大多数人估计都没有想到会这么快罢了。如果说有什么让笔者感到后怕的是,如果阿花狗从零开始,仅仅进行自我训练还能达到现在的高度的话,那将是非常可怕的能力。因为,这意味着阿花狗在自我进化方面已经具备了和人类并驾齐驱的实力,至少在围棋方面。当然,笔者强烈怀疑阿花狗能达到这种高度。首先,阿花狗很可能在自我演化中陷入局域最优解的陷阱,难以自拔。其次,这种自我演化过于缓慢,以至失去了实际意义。在人类的演化过程中,多样性起到了很重要的作用。不同文明的冲突与交流,对文明的进步起到了巨大的推动作用。相反,孤岛文明则往往发展缓慢并最终被淘汰。如果演化有多重分支的话,我强烈怀疑阿花狗会陷入某个分支无法脱出。解决这一问题的办法,可能需要众多阿花狗作为群体一同进化,以发挥群体优势。如果阿花狗的程序能够开源的话,完全可以多人联机,研究人工智能的群体行为。
人工智能何去何从?阿花狗已经向我们展示了电脑强大的学习能力。即便在赛前普遍不被媒体和大众看好,如今3:1的惊人战绩,让我们不得不重新审视人工智能的发展前景和未来。人类几千年来的发展不单单依赖强大的学习能力,更重要的还是创造和不断进化的能力。人工智能可以做到吗?不知道人工智能的极限在哪里?