WFU

網路心理

2017年5月25日 星期四

難解之「劫」— 理性與感性的賽局試煉


《人機大戰觀戰記(2)》,文/林煜軒|台大醫院精神部主治醫師,網路圍棋七段


「這局的前一百手棋,是我們見過所有人類與最新版本AlphaGo下得最勢均力敵的一盤」DeepMind創辦人哈薩比斯(Demis Hassabis)在賽後記者會透露研發團隊看到電腦的勝率分析數據。

柯潔雖然在第155手速敗,但哈薩比斯在對局後立即在推特短評「非常精彩而且複雜難解的比賽!柯潔把AlphaGo逼到了極限。」研發團隊為何如此讚賞這局棋?在近乎完美的前一百手之後,形勢如何急轉直下,戛然中止?

這局棋的焦點,是由圍棋最複雜難解的「劫爭」牽動全局攻防的精密計算。

圍棋的「劫」是指吃掉對方一顆子之後,自己所下的棋子雖然只剩一氣;但對方必須要在其他地方落子後,等到下一手才能再吃回這顆棋子。這個規則是避免雙方反覆提子,使得對局陷入無限循環之中。「劫」這個術語,源自印度佛教的時間單位,據考證「一大劫」約是13億年的時間。圍棋為「劫」訂下規則,循環無端的時間,轉換成棋盤上更複雜難以估計的空間變化。圍棋是以圍地多寡決定勝負,高手通常不會只是簡單地爭「劫」而已,而是會利用「劫」來小題大作、將戰火蔓延全局。例如自己放棄「劫爭」,在對方用兩手棋「消劫」的同時,自己的這兩手棋轉而在他處獲利。


「賽局理論」的基本前提—「人必須是理性的」


本局從第72手柯潔準備「造劫」到第137手AlphaGo「消劫」為止,從右下棋盤總共席捲了七條黑、白雙方「大龍」的死活。這65手棋的每一步劫爭,就像是滾雪球般地越滾越大。從科學的語言來說:每一步「劫爭」所需要的決策判斷,是一道比一道複雜「賽局論」難題。最終,在第65道複雜的「劫爭賽局」關卡中,柯潔表現得非常完美,但在最後判斷失準,AlphaGo第137手果斷「消劫」,為這場悲壯的賽局試煉劃下句點。


消劫:柯潔弈出白1(第136手)尋找「劫材」時,由於價值過小,AlphaGo果斷下出黑2(第137手) 「消劫」,此時柯潔已無勝算。柯潔的這手棋被公認是全局最後的敗著。


一位觀察細膩的記者詢問柯潔比賽時為何一度撫住胸口?柯潔表示他瞭解AlphaGo在優勢之下,往往會將局面導向簡明;然而本局AlphaGo卻一直沒有化簡這個複雜的「劫爭」。這使柯潔意識到:雖然局面複雜,但對局雙方必然勢均力敵。柯潔甚至一度認為自己非常接近勝利了,因而緊張地感受到心跳,所以想要按住胸口希望能夠緩和一些。然而就在此時,柯潔下了令自己後悔的壞棋。


感受到自己將接近勝利,同時感到緊張心跳加速而按住胸口的柯潔(本局直播之截圖)


「可能這就是人類很大的弱點,我覺得我的心態不夠沈穩。」柯潔的這句自白,點明了眾多的「賽局理論」中,一項最基本的前提—「人必須是理性的」。

在濃烈的求勝意志中,如何不讓勝負的情緒影響理性的決策判斷,沈穩地用每手棋解開複雜的賽局難題。這是身為「人類棋手」,在棋盤前永遠要面臨的試煉。



本文感謝關鍵評論網轉載