《人機大戰觀戰記(1)》,文/林煜軒|台大醫院精神部主治醫師,網路圍棋七段
今年圍棋的「人機大戰」第一局,AlphaGo以圍棋規則的最小差距1/4子戰勝當今世界排名第一的天才職業棋士柯洁。在去年AlphaGo戰勝南韓棋王李世乭之前,身為一位棋齡二十年以上的業餘高段棋士,我非常自豪擁有兩項無法被電腦取代的專長:一是我的興趣—圍棋,二是我的職業—精神科醫師。
比起去年見證學習二十幾年的圍棋,被人工智慧征服帶來的震撼與失落。今年的人機大戰,我感到有幸圍棋相伴的這二十餘年,讓我更能領略圍棋本質的奧妙,以及人工智慧所達到的深度。這一系列的觀戰記,希望結合我的職業與興趣,介紹人工智慧稱霸後,人腦還可以從圍棋學到什麼。
一、不利「賭徒心態」的圍棋規則
小時候在棋社經常見到這樣的景象:有一位中年大叔剛輸了兩目棋,懊惱剛才被逆轉的一處致命失著;立即向對手再下戰帖。由於復仇心切,大叔落子如飛,對手思考時,他不耐煩地在棋罐裡攪動棋子;宛如「炒豆子」的噪音,也是大叔焦躁的心聲。觀戰的資深棋友看到這番景象,幾乎都可以斷定這位大叔必敗。
面臨重大挫敗時,我們的大腦經常會自動開啟一種「賭徒心態」模式。這就像賭徒在連輸幾場之後,憤然壓上最後的所有籌碼,希望一舉反敗為勝。從認知科學的角度描述,即是「鎖定特定目標,增加攻擊強度與衝動性」。
然而圍棋在勝負規則,和其他競技有項很大的本質差異:圍棋是以圍地的多寡來決定勝負;象棋、西洋棋則是以吃掉對方主帥來決定勝負。大部分的電競規則也是以攻下主堡或殲滅主將判定輸贏。圍棋講求均衡,因此不容易「鎖定特定目標」;而衝動與思慮不周,不僅無法在棋盤上逆轉,通常還會兵敗如山倒。
二、克制「衝動」,鍛鍊「決策」
近年來研究發現「病態性賭博」和「藥物成癮」的大腦有許多相似之處:克制衝動的腦區比較不活躍、比較不能駕馭情緒,做「決策判斷」(decision making)時比較粗糙。這是「賭徒心態」─遇到挫敗時,不顧十賭九輸的極大賠率,衝動地一賭再賭,失控無法自拔的心理機制。
許多圍棋「妙手」雖然也是憑藉情急下的直覺應運而生,但在衝動的直覺後,必然有縝密的決策細算其後續手段。人工智慧帶來的震撼,讓許多看熱鬧的朋友們建議在人機大戰時,用找程式缺陷(bug)的工程觀點,或是從武俠小說破解珍瓏棋局巧合,提出「無招勝有招」的建議…如果後續沒有仔細的規劃,這些充其量也只是必敗無疑的「賭徒心態」。
柯洁在賽前專訪時提到「把AlphaGo當作人類對手去拼」是非常值得讚許的正確心態。想用沒有仔細研究過的奇招,或是找人工智慧bug的心態作為應對,這個「戰略」本身就是個有極大缺陷的bug。別說要贏過人工智慧,要贏過人類可能都有困難。
三、講究配合,追求效率
圍棋和其他競技還有一項很大的差別:圍棋黑白兩種棋子,每顆棋子價值均等;沒有「將士相車馬砲」的階級之分。但這種沒有階級之分的棋子配合,其複雜度遠勝於其他的競技。此外,圍棋以圍地大小分勝負,如何讓每顆棋子發揮最大的效率,是近三百年圍棋史上每次圍棋理論有重大突破的關鍵。
講究棋子配合而形成「子力」強弱的決策,類似今日重視團隊合作的領導能力。而追求效率的價值觀,也與主流的企業文化不謀而合。圍棋比其他競技更接近商業決策這類現實生活的決策。因此織田信長等戰國名將,認為圍棋是模擬戰爭決策的鍛鍊,而大力提倡圍棋;德川家康進而奠定職業圍棋制度,以冀能更深入鑽研圍棋的奧秘。
令人震驚,餘韻無窮的一手棋:AlphaGo白棋第54手「斷」(座標E,10標記▲的白棋)。這是一步看似沒有任何立即效果的「後手」。但此後其上方被黑棋包圍住已然死去的四顆白子(呈「T」字型),卻陰魂不散地讓執黑的柯洁在接下來的大半棋局中,如芒刺在背、左右掣肘。
人機大戰第一局AlphaGo最驚艷的一手—第54手「斷」,是一步讓死子發揮最大犧牲效益的妙招。幾乎所有的職業棋士都表示這是一步難以發現的好棋。在這步棋之後,AlphaGo不但圍到的「實地」穩定領先,所有棋子的效率也優於柯洁。這步妙手並非難以理解,而是不易發現。致勝的原理就在於這手使得AlphaGo的全局配置,甚至死去的棋子都展現出高效率,而對手柯洁的棋子效率處處受限,不好發揮。
人機大戰雖然看似勝負已定,但這次人工智慧帶來的震撼與啟發絕對不遜去年。感謝AlphaGo團隊與柯洁的精彩一局,讓我們期待欣賞古老技藝與尖端科技的智慧火花。