焦點評論:圍棋電腦為何戰勝人腦(王銘琬)

出版時間:2016/03/14

谷歌主導開發的圍棋對弈軟體AlphaGo與世界一流棋手李世乭舉行一百萬美元獎金的5局大賽,AlphaGo從開始連勝3局,一口氣決定勝利。這次比賽谷歌為了取得數據,約定不管比數,5局下滿,3局之後對局已與勝負無關,雖然第4局李世乭贏了,讓人類不至於太沒面子,谷歌也不會太惹人類討厭,不過誰是強者,不言自明。

前3局比賽讓人感覺AlphaGo愈戰愈強。第3局讓李世乭從頭輸到尾,西洋棋與日本將棋敗給電腦時,有一段拉鋸的過程,而圍棋居然一次就被打垮,對熟悉李世乭神勇的棋迷們,一時無法接受這個現實。我1年前參加趨勢科技圍棋程式團隊Go Trend,目標就是今天的AlphaGo,加上我職業棋士的身分,可以說是被雙重打敗。
有人認為這次李世乭變得壓力過大,沒發揮真正實力;不過只要是人,心理與生理的波動在所難免。鬆懈、恐懼、緊張、疲勞,任何因素都可能影響發揮程度;圍棋一盤棋,單方須下一百多手,頂尖決戰一手失誤就無可挽回,而機器每著棋會保持在一定水準以上。

賽前僅少數人看好

除了身心狀態是人類弱點外,思考方式也不佔便宜。AlphaGo下棋,是一種純粹機械式的反應,如同自販機投入目前局面,它就吐出一個答案,雖然現在使用的概率處理,同樣局面有時會有不同答案,重點是,它是完全客觀的。
而人下棋,還是需要邏輯,因為A所以B,此後應是C的一個推論,下棋時也會有這個思維,從某種角度來說,是用前後的狀況,作一種故事性的解讀,很想找出因果關係來。
人這樣做當然有道理,想找出關鍵提高效率,無須每一手重新作全局的判斷;但這種思考法難免有主觀混入,影響正確性。AlphaGo動用龐大硬體資源,用超高的計算力得到絕對的客觀性,換掉李世乭,不見得會有別的結果,若論取勝的能力,AlphaGo已經超過人了。
這次比賽引起全球關心,因為圍棋是棋類最後的堡壘,西洋棋等多是以擒王為目的的遊戲,目標明確,是電腦所擅長的;而圍棋的目的是佔領的地域勝過對方,是全局的綜合累積,目標散漫,電腦一直找不到適當的評估法。賽前只有少數AI(人工智慧)界的人看好AlphaGo,比賽結果讓人認識電腦威力,預感AI大舉進入生活的未來。
谷歌並非發明多驚人的技術,AlphaGo是把既有的深度學習(Deep Learning)與蒙地卡羅樹搜尋 (MCTS) 技術做了巧妙的結合;連AlphaGo團隊都沒想到效果會這麼好,這個方向是去年圍棋程式的熱門話題,但必須動員龐大的軟硬體資源。谷歌拿出財力與魄力,約投資四億美元,並動用集團資源,得到驚人的成果。
要下好圍棋,死背棋譜沒用,需要對棋盤全體直覺式的認識,電腦程式必須用語言記述,「感覺」是很難涉及的領域,然而深度學習就是學習人的感覺的技術,讓電腦得到類似人的感覺。
這次在圍棋打敗人的結果,讓社會改變對AI的看法,我的朋友告訴我,原本他不相信自動駕駛,現在開始覺得說不定比自己還可靠。電腦可能奪走我們的工作,本來就是近來的熱門話題,雖說AlphaGo的規格大得驚人無法馬上轉用到別的領域,但這次大賽結果很清楚的告訴我們,這不是杞人憂天。

自我學習磨練品質

可怕的是,谷歌AlphaGo成軍約只1年,在很短的時間達到這個高度,因為有自我學習的機能,能不眠不休的磨練自己的品質,AI的成長不僅僅是範圍擴大,它的速度也可能超乎我們的想像。
當電腦能把一件事做得比我們好的時候,我們該教它們什麼?或者不能教它們什麼呢?AlphaGo留給我們一個新的問題。

旅日圍棋九段棋士

下載「台灣蘋果日報APP



有話要說 投稿「即時論壇」
更多

《要聞》

新聞