碁人專欄

碁人專欄

期待東坡棋──寫在人機大戰2.0第二局賽前

分享

窗外淅瀝瀝的雨聲，在不眠的夜深時分更添幾分孤寂。

人機大戰首局，柯潔執黑落敗，他自己說「輸得沒有脾氣」。明天的第二局輪到柯潔執白，他會下出怎麼樣的棋局呢？去年AlphaGo和李世乭的決戰，小李唯一獲勝的第四局即是拿白棋贏的；AlphaGo自我對弈的評估，也顯示現行的貼目規則下，執黑是比較辛苦的。這次的人機大戰2.0，柯潔已完全不被看好，但我想，還是有很多棋迷，對這第二局人類執白──懷著渺茫的一點希望。

第一局結果，柯潔執黑負1/4子，看似接近，但實際差距不止如此。AlphaGo在終局階段選擇穩妥獲勝的路而退讓不少。

然而，我對於柯潔執白的期待不止於此。今年年初，AlphaGo化身Master在網路上的60盤測試棋，原本最後一盤是要由柯潔壓軸挑戰，後因他身體不適住院而改由古力代打，柯潔在微博上略有不甘地宣稱他原本有準備「秘密武器」。據悉，柯少俠當時所準備的絕招，即是「東坡棋」，也就是所謂的「模仿棋」。

對於東坡棋，想必很多人乍聽都是嗤之以鼻的。不過，職業棋士的東坡棋，並不是只是一味地模仿，也不是為了激怒對手，更不會是懶得認真想、胡鬧一番。東坡棋的目的，說穿了，是為了先和對手戰成平手，等待適當地時機，再一舉變著、取得優勢。吳清源大國手當年第一次與木谷實對陣，便嘗試過東坡棋的下法，賽後兩人徹夜長談彼此對棋道的追求，更從此成為關係最緊密的好友。

在Master的60盤棋中，紅面棋王周俊勳也有祭出東坡棋戰術。但是必須分辨的是，周九段用的是執黑先著天元，再模仿白棋的下法，吳清源當年對木谷也是執黑用東坡棋。不過卻有一天壤之別，就是現今的規則黑棋必須「貼目」了，故黑棋的東坡棋僅與白戰成平手是無法獲勝的，是以後來周九段中盤趕緊變招出擊，最終玉碎落敗。這樣看來，黑棋的東坡棋反而給自己莫大的壓力，預計「後動」，卻是「被動」了。

然而，真正厲害的，是白棋的東坡棋。棋友可能會想，拿白棋還模仿黑棋，又有什麼差別？那黑棋不是下天元就好了嗎？奧妙正在於此，天元雖然處於棋盤的中心，理論上是最平衡的一個著點，但是在空蕩蕩的情況之下落子天元，由於棋盤中央尚缺少棋子配合，通常是難以發揮效用的。白棋模仿黑棋，在黑棋落子天元之前，是確實能與黑棋保持平手的局面的。進一步的關鍵則是，或在黑落子天元之前、或在之後，選擇一個恰當的時機變著，一舉讓棋子的效率超過對方，並努力維持到終局。必須貼目的既是黑棋，那白棋只要不被追上貼目，即可獲勝。

不過，在AlphaGo這樣強大的對手面前，只要對圍棋稍有了解便不難想到的這個戰術，會有用嗎？

在此，且讓我稍微岔個題，聊一下在過去下東坡棋最有名的棋手──藤澤朋齋。藤澤朋齋本名藤澤庫之助，是日本棋院歷史上的第一位九段，在原本應該屬於他的時代，因為在十番的舞臺上兩敗於吳清源，而黯然失色了。

藤澤朋齋題字

藤澤的東坡棋是非常有名的。他在三、四段的時候，就有「黑番不敗」的名聲，棋風穩重而厚實，但他當時執白的布局常常過緩，是以他便嘗試用東坡棋的策略。但是，在他登上九段的高位之後，甚至於在輸給吳清源、退出日本棋院，改名朋齋再回歸棋壇之後，他仍然持續不斷地嘗試東坡棋。這究竟是為什麼呢？

江崎誠致在《昭和的棋》一書中，談到藤澤的東坡棋。他認為與其從圍棋的技術上去討論，不如想一想，藤澤在不同的階段、不同的處境下從一而終地堅持東坡棋的心態：

世間是有這樣一種人的，他們儘管擁有創造財富的才能，卻能夠安於清貧。這些人之所以採取了這樣的生活態度，是因為他們覺悟到貧富並不是評判人生價值的標準。這個比方聽起來或許有些突兀，但我無法不認為，藤澤孜孜不倦地下模仿棋，就是在棋道上追求清貧。

我認為，藤澤是在沒有個性的模仿棋中追求自我的個性。

我相信肯定還是會有很多人覺得，這不過是在為「東坡棋」美化門面的說辭罷了。不過，這就是一種選擇。與吳清源、木谷實一樣，藤澤朋齋確實是屬於一心一意求道的性格，在吳清源的故事裡他雖然淪為配角，可是若從他本人的角度來看呢？他的一生都奉獻給圍棋，只有圍棋而已。他不可能不知道這樣的堅持，等於把「東坡棋」、「模仿棋」這個標記，深深地烙印在自己的身上。我們談起東坡棋，就想到藤澤朋齋，談起藤澤，也就想起東坡棋。這是他的選擇。

說了這麼多，只是想說，東坡棋並不只有模仿，它確實也是求勝、求道上的一種選擇。它肯定不是一般人會欽佩、嚮往的一條路，甚至表面上看來無味且平庸，更必須擔負罵名，但是──蟄伏沉潛，等待時機，忍耐孤獨，你可以不贊成，但不能不認同，那是更艱難、更冒險的一個選擇。

第一局，AlphaGo意外的54手。人類無法冒險選擇這樣看不清楚收穫的著手。

最後回到剛剛的問題：「會有用嗎？」大家都說肯定沒用，主要的論點是「DeepMind團隊一定想過應對方式」，但我覺得未必盡然，理由有三：

第一，與其說DeepMind團隊一定想過應對方式，不如說他們一定「測試過」下東坡棋，但不見得有辦法、更不見得會在程式演算法中去干涉AlphaGo的深度學習選擇。那麼，即使黃士傑博士嘗試過和AlphaGo下東坡棋，他和柯潔的棋力不同，選擇變著的場合也必定不同，如何能肯定柯潔來下一定沒有效呢？

第二，AlphaGo與人類不同，人類一看到東坡棋，便知曉了對手的意圖，並且開始謀畫如何盡量提高「天元」位置的重要性，利用下在天元來取得優勢。但AlphaGo會有「原來你想跟我先戰成平手」的理解能力嗎？我想合理的推測是，它仍然會選擇經過計算，棋盤上效益最高的一手，直到「天元」成為那一手時，它才會下在天元，而不會主動去創造出使天元成為最重要一手的局面。

第三，DeepMind的Demis Hassabis曾經在演講中透露，他們請樊麾測試過，若讓樊麾加上AlphaGo來對陣AlphaGo，也就是說，樊麾對局時大部分都採用AlphaGo自己的棋步，只有在覺得有更好的選擇時才出手變招，這樣是可以擊敗AlphaGo的。這代表的意義是，也許在序盤布局，人類難以像AlphaGo一樣掌握全局，但是在選擇局部最佳解的計算能力上，人類仍有一些優勢，畢竟AlphaGo永遠作的是全局的計算。

綜言之，柯潔若選擇使用東坡棋，保持平手的局面，且真的能在適當時機下出更好的著手，那麼並非沒有可能「暫時取得些許優勢」；而即使這樣的優勢很微小，但人類的後半盤相對而言，也不是沒有機會避免失誤，保持這樣的優勢到終局。更何況，如果現行的貼目確實對黑棋更有負擔的話，那AlphaGo是否能夠在相對變化少的局面下搶到7.5目？仍然值得期待吧。如果AlphaGo真的能夠做到，那麼表面上平淡無趣的東坡棋，實際上也會是暗潮洶湧、錙珠必較、無比激烈的一場惡戰啊！

這是我之所以，在大戰前夕如此期待東坡棋的原因。當然，承認AlphaGo優於全人類頂尖高手，已是不爭的事實。選擇東坡棋，我想已不只是追求棋道上的清貧，更是承認了人類千百年來積累的渺小，我們等於先認輸，同意AlphaGo的著點更好，然後等待。

雨不停歇，道無止盡。在追求圍棋真理的道路上，我們並不孤獨。話說AlphaGo的自我對弈盤數，如今不曉得是多少？當初聽到的數字就已經是三千萬盤，這是任何人類窮極一生也無法達到的數字。但即使如此，AlphaGo大師也還沒有到達圍棋的盡頭。既然還沒到達，那就仍然值得我們嘗試吧。如果不嘗試東坡棋，或許也會是一個缺憾？

黃膺皓記於2017.05.25凌晨2:02

★瀏覽其他專欄文章請點選更多文章

作者介紹

黃膺皓業餘6段

台大中文所畢業的黃老師，是棋院早期的畢業生，教學用心、認真，對每一位小朋友的禮貌和學習態度都非常要求，對上課的教材與講義製作非常用心，是兼具教學熱誠與活力的好老師。