繼象棋之后 人機(jī)大戰(zhàn)為何選中圍棋?
問(wèn)凝
關(guān)于人機(jī)大戰(zhàn),早在1997年,一臺(tái)叫做“深藍(lán)”的超級(jí)計(jì)算機(jī)在國(guó)際象棋上下贏了國(guó)際象棋冠軍卡斯帕羅夫。“深藍(lán)”是一臺(tái)超級(jí)計(jì)算機(jī),雖然跟人工智能程序Alpha Go好像不是同一回事,但是其實(shí)人工智能程序也需要以計(jì)算機(jī)作為載體才能工作,就像大腦也需要有身體才行。因此,把它們放在一起比較并不奇怪。而隨著超級(jí)計(jì)算機(jī)技術(shù)的不斷發(fā)展,即使是今天最普通的集成顯卡的性能也超過(guò)了700GFLOPS。“深藍(lán)”已經(jīng)從逐漸跟不上腳步到被甩開(kāi)了一大截。值得一提的是,世界上最快的超級(jí)計(jì)算機(jī)是我們國(guó)家的天河2號(hào),其性能達(dá)到了33.86PFLOPS,是“深藍(lán)”計(jì)算機(jī)的30萬(wàn)倍。
那么,跟“深藍(lán)”計(jì)算機(jī)相比,谷歌Alpha Go的性能又怎么樣呢?此前谷歌曾經(jīng)在《自然》雜志上發(fā)表過(guò)關(guān)于這個(gè)人工智能系統(tǒng)的文章,其中稱(chēng),Alpha Go人工智能的計(jì)算機(jī)裝有48個(gè)CPU和8個(gè)GPU。我們似乎無(wú)法將兩者放在一起直接比較,因?yàn)锳lpha Go是在云計(jì)算平臺(tái)上運(yùn)行的,我們可以通過(guò)競(jìng)爭(zhēng)對(duì)手的計(jì)算機(jī)數(shù)據(jù)來(lái)進(jìn)行大概的比較,比如阿里云。
2015年12月,阿里云對(duì)外開(kāi)放高性能計(jì)算服務(wù)。這些計(jì)算機(jī)的單機(jī)浮點(diǎn)運(yùn)算能力是11TFLOPS。如果谷歌的計(jì)算機(jī)性能與阿里云接近的話,那么Alpha Go所驅(qū)動(dòng)的硬件的性能至少是深藍(lán)的1000倍。
說(shuō)起圍棋和人工智能,我們可能多少都了解一些,不過(guò)二者是怎么聯(lián)系到一塊的呢?
那是因?yàn)闄C(jī)器戰(zhàn)勝人類(lèi),一個(gè)關(guān)鍵就是圍棋。擁有悠久歷史的圍棋高度反映了人類(lèi)的智慧,圍棋棋盤(pán)縱橫19道,361個(gè)交叉點(diǎn),涉及到的可能出現(xiàn)的局面數(shù)量最大可達(dá)3^361,大致的體量是10^170,而已經(jīng)觀測(cè)到的宇宙中,原子的數(shù)量才10^80,國(guó)際象棋最大只有2^155種局面,這是什么概念?看似簡(jiǎn)單的縱橫19道,361個(gè)交叉點(diǎn),形成了浩瀚的宇宙。所以有人說(shuō),圍棋是體現(xiàn)人類(lèi)智慧的最好游戲,之前還有人預(yù)測(cè),人工智能(AI)需要再花十幾年才能戰(zhàn)勝人類(lèi),所以若拋去商業(yè)元素,這場(chǎng)比賽的意義可能在于見(jiàn)證歷史,足以說(shuō)明當(dāng)前人工智能的技術(shù)研究已經(jīng)達(dá)到新高度。
AI下圍棋,究竟有多難?
難點(diǎn)1:圍棋對(duì)弈的基礎(chǔ)是死活的確認(rèn),確定棋盤(pán)上一塊棋的死活是最基本的,但要搞清楚一塊棋是死是活是非常困難的,而且,這種似死似活的狀態(tài)又是在不斷變化的。研究局部死活搜索是AI圍棋發(fā)展的一個(gè)難點(diǎn)。
難點(diǎn)2:棋形體現(xiàn)著人類(lèi)形象思維獨(dú)有的特性,棋手對(duì)棋形的感覺(jué)完全依賴(lài)于自身的經(jīng)驗(yàn),而這種感覺(jué)恰恰是勝負(fù)的關(guān)鍵,也是棋手水平高低的標(biāo)志。人類(lèi)棋手不愿意浪費(fèi)自己的棋子去無(wú)謂地攻擊對(duì)方活的棋形或無(wú)謂地試圖挽救自己死的棋形,要賦AI這種對(duì)棋形的感覺(jué),則是人工智能面臨的重要課題。
難點(diǎn)3:此外,還需要研究特殊的算法來(lái)解決快速識(shí)別問(wèn)題,著名的電腦圍棋程序設(shè)計(jì)者布恩說(shuō)過(guò): “有了快速的模式識(shí)別方法,就不難教程序利用手筋來(lái)吃棋。”所以說(shuō),模式識(shí)別算法是圍棋博弈程序的重要組成部分,高效的模式識(shí)別算法反映著博弈程序的水平,當(dāng)電腦的模式識(shí)別技術(shù)發(fā)展到能與人腦匹敵時(shí),電腦圍棋的棋力離專(zhuān)業(yè)九段就不遠(yuǎn)了。
簡(jiǎn)單來(lái)說(shuō),一方面,圍棋規(guī)則非常復(fù)雜,每一步的調(diào)整,都會(huì)產(chǎn)生更多的可能,這對(duì)機(jī)器的計(jì)算能力要求很高。另一方面,即使機(jī)器中存儲(chǔ)了足夠多的已有圍棋大戰(zhàn)數(shù)據(jù),由于圍棋規(guī)則的復(fù)雜程度和棋手的無(wú)法預(yù)測(cè)的落子,對(duì)機(jī)器的應(yīng)變能力或深度學(xué)習(xí)能力有更高的要求。
4.下圍棋這么復(fù)雜,AI靠什么取勝?
上面說(shuō)的那么難,難道AI就沒(méi)機(jī)會(huì)取勝了?NO NO NO~
為了擊敗人類(lèi),研究者們拿出了大殺器——這就是人工智能領(lǐng)域新一代的機(jī)器學(xué)習(xí)(machine learning)形式——深度學(xué)習(xí)(deep learning)和強(qiáng)化學(xué)習(xí)(reinforcement learning)。
深度學(xué)習(xí)的概念換句話說(shuō),就是讓計(jì)算機(jī)像人腦一樣去學(xué)習(xí)和思考。和傳統(tǒng)的機(jī)器學(xué)習(xí)不同,深度學(xué)習(xí)是把計(jì)算機(jī)科學(xué)和人類(lèi)的神經(jīng)學(xué)結(jié)合起來(lái),讓計(jì)算機(jī)自主學(xué)習(xí)。比如,不是由人告訴計(jì)算機(jī)這是一只貓,然后讓它來(lái)進(jìn)行識(shí)別和印證。而是給計(jì)算機(jī)提供大量的圖片數(shù)據(jù),讓它自己學(xué)習(xí)和分析,然后自主形成“貓”的概念,就像人類(lèi)大腦的視覺(jué)皮層那樣反應(yīng)。有了具備深度學(xué)習(xí)能力的人工智能系統(tǒng),以后駕車(chē)出行時(shí),汽車(chē)就能主動(dòng)提醒你周?chē)穆窙r,還能應(yīng)用于語(yǔ)音和臉部識(shí)別、醫(yī)療診斷等領(lǐng)域。
強(qiáng)化學(xué)習(xí)一詞來(lái)自于行為心理學(xué),這一理論把行為學(xué)習(xí)看成是反復(fù)試驗(yàn)的過(guò)程,從而把動(dòng)態(tài)環(huán)境狀態(tài)映射成相應(yīng)的動(dòng)作。它類(lèi)似于傳統(tǒng)經(jīng)驗(yàn)中的“吃一塹長(zhǎng)一智”,強(qiáng)化學(xué)習(xí)可以做出策略選擇,廣泛應(yīng)用于下棋、走迷宮這一類(lèi)別中。這種依賴(lài)于大數(shù)據(jù)和強(qiáng)大計(jì)算能力的被稱(chēng)為“深度學(xué)習(xí)”的無(wú)監(jiān)督或半監(jiān)督機(jī)器學(xué)習(xí),使計(jì)算機(jī)可以在無(wú)需人力參與的情況下,完成原本只有經(jīng)過(guò)高度專(zhuān)業(yè)化訓(xùn)練的專(zhuān)業(yè)人士才能完成的任務(wù),甚至超過(guò)專(zhuān)家。
另外,為了達(dá)到更高的運(yùn)算能力,谷歌還把Alpha Go接入到了一個(gè)有1202個(gè)CPU組成的網(wǎng)絡(luò)中。這使得這個(gè)人工智能系統(tǒng)的計(jì)算能力在原來(lái)的基礎(chǔ)上增加了24倍。經(jīng)過(guò)推算,Alpha Go的性能大約是深藍(lán)計(jì)算機(jī)的2.5萬(wàn)倍左右。按這個(gè)節(jié)奏計(jì)算,假如人類(lèi)一年能玩1000局,AI一天就可能玩100萬(wàn)局。所以Alpha Go只要經(jīng)過(guò)了足夠的訓(xùn)練,還是有可能擊敗人類(lèi)選手。畢竟,人類(lèi)在長(zhǎng)時(shí)間的下棋比賽后,由于生理和心理限制可能會(huì)疲累,進(jìn)而犯錯(cuò),但機(jī)器不會(huì)。
不過(guò)谷歌董事長(zhǎng)施密特表示,即使機(jī)器真的贏了,人類(lèi)仍是贏家。即使AlphaGo機(jī)器最終贏了李世石,對(duì)于人工智能是否會(huì)“碾壓”人類(lèi),依然存疑,我們不必過(guò)于焦慮,人工智能可能還有很長(zhǎng)的路要走。
歷史上的人機(jī)大戰(zhàn)
①深藍(lán)戰(zhàn)勝卡斯帕羅夫
1997年,美國(guó)IBM公司的“深藍(lán)”超級(jí)計(jì)算機(jī)深藍(lán)以二勝一負(fù)三平的戰(zhàn)績(jī)戰(zhàn)勝了當(dāng)時(shí)世界排名第一的國(guó)際象棋大師卡斯帕羅夫,成為贏家。
②浪潮天梭挑戰(zhàn)人類(lèi)象棋大師
2006年的浪潮天梭超級(jí)計(jì)算機(jī),挑戰(zhàn)人類(lèi)象棋大師一役,在最終的巔峰對(duì)決中,許銀川與浪潮天梭兩戰(zhàn)皆和。浪潮天梭向世人證明了自己超強(qiáng)的運(yùn)算能力。
③全才學(xué)霸沃森挑戰(zhàn)人類(lèi)
2011年,“深藍(lán)”的同門(mén)師弟“watson”(沃森)在美國(guó)老牌智力問(wèn)答節(jié)目《危險(xiǎn)邊緣》中挑戰(zhàn)兩位人類(lèi)冠軍,并獲得成功。
④Alpha Go以5:0完勝歐洲冠軍樊麾
2016年1月,美國(guó)谷歌公司旗下的人工智能(AI)開(kāi)發(fā)商“DeepMind”(位于英國(guó))研發(fā)的圍棋電腦軟件“AlphaGo”(阿爾法圍棋)打敗了職業(yè)棋手樊麾,開(kāi)創(chuàng)全球先河。
進(jìn)入21世紀(jì)后,科學(xué)研究從大數(shù)據(jù)、人工智能到虛擬現(xiàn)實(shí),從發(fā)現(xiàn)了類(lèi)地球行星、引力波到無(wú)人駕駛、量子計(jì)算,這是一個(gè)創(chuàng)新不斷、驚喜不斷的時(shí)代,而我們有幸參與其中,這也許比單純討論比賽輸贏更有趣。