期待東坡棋──寫在人機大戰2.0第二局賽前


窗外淅瀝瀝的雨聲,在不眠的夜深時分更添幾分孤寂。

人機大戰首局,柯潔執黑落敗,他自己說「輸得沒有脾氣」。明天的第二局輪到柯潔執白,他會下出怎麼樣的棋局呢?去年AlphaGo和李世乭的決戰,小李唯一獲勝的第四局即是拿白棋贏的;AlphaGo自我對弈的評估,也顯示現行的貼目規則下,執黑是比較辛苦的。這次的人機大戰2.0,柯潔已完全不被看好,但我想,還是有很多棋迷,對這第二局人類執白──懷著渺茫的一點希望。

第一局結果,柯潔執黑負1/4子,看似接近,但實際差距不止如此。AlphaGo在終局階段選擇穩妥獲勝的路而退讓不少。

然而,我對於柯潔執白的期待不止於此。今年年初,AlphaGo化身Master在網路上的60盤測試棋,原本最後一盤是要由柯潔壓軸挑戰,後因他身體不適住院而改由古力代打,柯潔在微博上略有不甘地宣稱他原本有準備「秘密武器」。據悉,柯少俠當時所準備的絕招,即是「東坡棋」,也就是所謂的「模仿棋」。

對於東坡棋,想必很多人乍聽都是嗤之以鼻的。不過,職業棋士的東坡棋,並不是只是一味地模仿,也不是為了激怒對手,更不會是懶得認真想、胡鬧一番。東坡棋的目的,說穿了,是為了先和對手戰成平手,等待適當地時機,再一舉變著、取得優勢。吳清源大國手當年第一次與木谷實對陣,便嘗試過東坡棋的下法,賽後兩人徹夜長談彼此對棋道的追求,更從此成為關係最緊密的好友。

在Master的60盤棋中,紅面棋王周俊勳也有祭出東坡棋戰術。但是必須分辨的是,周九段用的是執黑先著天元,再模仿白棋的下法,吳清源當年對木谷也是執黑用東坡棋。不過卻有一天壤之別,就是現今的規則黑棋必須「貼目」了,故黑棋的東坡棋僅與白戰成平手是無法獲勝的,是以後來周九段中盤趕緊變招出擊,最終玉碎落敗。這樣看來,黑棋的東坡棋反而給自己莫大的壓力,預計「後動」,卻是「被動」了。

然而,真正厲害的,是白棋的東坡棋。棋友可能會想,拿白棋還模仿黑棋,又有什麼差別?那黑棋不是下天元就好了嗎?奧妙正在於此,天元雖然處於棋盤的中心,理論上是最平衡的一個著點,但是在空蕩蕩的情況之下落子天元,由於棋盤中央尚缺少棋子配合,通常是難以發揮效用的。白棋模仿黑棋,在黑棋落子天元之前,是確實能與黑棋保持平手的局面的。進一步的關鍵則是,或在黑落子天元之前、或在之後,選擇一個恰當的時機變著,一舉讓棋子的效率超過對方,並努力維持到終局。必須貼目的既是黑棋,那白棋只要不被追上貼目,即可獲勝。

不過,在AlphaGo這樣強大的對手面前,只要對圍棋稍有了解便不難想到的這個戰術,會有用嗎?

在此,且讓我稍微岔個題,聊一下在過去下東坡棋最有名的棋手──藤澤朋齋。藤澤朋齋本名藤澤庫之助,是日本棋院歷史上的第一位九段,在原本應該屬於他的時代,因為在十番的舞臺上兩敗於吳清源,而黯然失色了。

藤澤朋齋題字

藤澤的東坡棋是非常有名的。他在三、四段的時候,就有「黑番不敗」的名聲,棋風穩重而厚實,但他當時執白的布局常常過緩,是以他便嘗試用東坡棋的策略。但是,在他登上九段的高位之後,甚至於在輸給吳清源、退出日本棋院,改名朋齋再回歸棋壇之後,他仍然持續不斷地嘗試東坡棋。這究竟是為什麼呢?

江崎誠致在《昭和的棋》一書中,談到藤澤的東坡棋。他認為與其從圍棋的技術上去討論,不如想一想,藤澤在不同的階段、不同的處境下從一而終地堅持東坡棋的心態:

世間是有這樣一種人的,他們儘管擁有創造財富的才能,卻能夠安於清貧。這些人之所以採取了這樣的生活態度,是因為他們覺悟到貧富並不是評判人生價值的標準。這個比方聽起來或許有些突兀,但我無法不認為,藤澤孜孜不倦地下模仿棋,就是在棋道上追求清貧。

我認為,藤澤是在沒有個性的模仿棋中追求自我的個性。

我相信肯定還是會有很多人覺得,這不過是在為「東坡棋」美化門面的說辭罷了。不過,這就是一種選擇。與吳清源、木谷實一樣,藤澤朋齋確實是屬於一心一意求道的性格,在吳清源的故事裡他雖然淪為配角,可是若從他本人的角度來看呢?他的一生都奉獻給圍棋,只有圍棋而已。他不可能不知道這樣的堅持,等於把「東坡棋」、「模仿棋」這個標記,深深地烙印在自己的身上。我們談起東坡棋,就想到藤澤朋齋,談起藤澤,也就想起東坡棋。這是他的選擇。

說了這麼多,只是想說,東坡棋並不只有模仿,它確實也是求勝、求道上的一種選擇。它肯定不是一般人會欽佩、嚮往的一條路,甚至表面上看來無味且平庸,更必須擔負罵名,但是──蟄伏沉潛,等待時機,忍耐孤獨,你可以不贊成,但不能不認同,那是更艱難、更冒險的一個選擇。

第一局,AlphaGo意外的54手。人類無法冒險選擇這樣看不清楚收穫的著手。

最後回到剛剛的問題:「會有用嗎?」大家都說肯定沒用,主要的論點是「DeepMind團隊一定想過應對方式」,但我覺得未必盡然,理由有三:

第一,與其說DeepMind團隊一定想過應對方式,不如說他們一定「測試過」下東坡棋,但不見得有辦法、更不見得會在程式演算法中去干涉AlphaGo的深度學習選擇。那麼,即使黃士傑博士嘗試過和AlphaGo下東坡棋,他和柯潔的棋力不同,選擇變著的場合也必定不同,如何能肯定柯潔來下一定沒有效呢?

第二,AlphaGo與人類不同,人類一看到東坡棋,便知曉了對手的意圖,並且開始謀畫如何盡量提高「天元」位置的重要性,利用下在天元來取得優勢。但AlphaGo會有「原來你想跟我先戰成平手」的理解能力嗎?我想合理的推測是,它仍然會選擇經過計算,棋盤上效益最高的一手,直到「天元」成為那一手時,它才會下在天元,而不會主動去創造出使天元成為最重要一手的局面。

第三,DeepMind的Demis Hassabis曾經在演講中透露,他們請樊麾測試過,若讓樊麾加上AlphaGo來對陣AlphaGo,也就是說,樊麾對局時大部分都採用AlphaGo自己的棋步,只有在覺得有更好的選擇時才出手變招,這樣是可以擊敗AlphaGo的。這代表的意義是,也許在序盤布局,人類難以像AlphaGo一樣掌握全局,但是在選擇局部最佳解的計算能力上,人類仍有一些優勢,畢竟AlphaGo永遠作的是全局的計算。

綜言之,柯潔若選擇使用東坡棋,保持平手的局面,且真的能在適當時機下出更好的著手,那麼並非沒有可能「暫時取得些許優勢」;而即使這樣的優勢很微小,但人類的後半盤相對而言,也不是沒有機會避免失誤,保持這樣的優勢到終局。更何況,如果現行的貼目確實對黑棋更有負擔的話,那AlphaGo是否能夠在相對變化少的局面下搶到7.5目?仍然值得期待吧。如果AlphaGo真的能夠做到,那麼表面上平淡無趣的東坡棋,實際上也會是暗潮洶湧、錙珠必較、無比激烈的一場惡戰啊!

這是我之所以,在大戰前夕如此期待東坡棋的原因。當然,承認AlphaGo優於全人類頂尖高手,已是不爭的事實。選擇東坡棋,我想已不只是追求棋道上的清貧,更是承認了人類千百年來積累的渺小,我們等於先認輸,同意AlphaGo的著點更好,然後等待。

雨不停歇,道無止盡。在追求圍棋真理的道路上,我們並不孤獨。話說AlphaGo的自我對弈盤數,如今不曉得是多少?當初聽到的數字就已經是三千萬盤,這是任何人類窮極一生也無法達到的數字。但即使如此,AlphaGo大師也還沒有到達圍棋的盡頭。既然還沒到達,那就仍然值得我們嘗試吧。如果不嘗試東坡棋,或許也會是一個缺憾?

 

黃膺皓 記於2017.05.25凌晨2:02

 

★瀏覽其他專欄文章請點選更多文章


作者介紹

黃膺皓  業餘6段

台大中文所畢業的黃老師,是棋院早期的畢業生,教學用心、認真,對每一位小朋友的禮貌和學習態度都非常要求,對上課的教材與講義製作非常用心,是兼具教學熱誠與活力的好老師。