體育 | AI來的這一年重寫圍棋江湖

稿源:南方人物周刊 | 作者: 本刊記者 徐梅 日期: 2018-06-14

“人類對抗AI”的悲壯才過去一年,圍棋國手們已能放下尊嚴向AI討教,但他們要適應的遠不止全新的圍棋理論……技術席卷而至,我們能夠持守的根基是什么?這一問題對圍棋江湖外的人來說同樣耐人尋味

柯潔贏了。

6月7日下午,柯潔在中國棋院四樓天元圍棋演播室戰(zhàn)勝連笑,拿下中國龍星戰(zhàn)冠軍,也守住了他最為看重的中國圍棋等級分第一人的王座。

此役之前,連笑手握天元、名人兩大頭銜戰(zhàn)冠軍,與柯潔的等級分僅差三分。這也是三年來柯潔第一次面對真正的挑戰(zhàn),自2015年9月超過當時排名第一的時越,坐上江湖頭把交椅后,還沒有人如此接近過他。去年歲末韓國棋手樸廷桓從柯潔手中搶走了世界排名第一,柯潔卻表示自己早就說過那個榜單并非官方排名,自己看重的還是國內(nèi)等級分第一。

大比分2比1戰(zhàn)勝好友連笑,柯潔連續(xù)33個月領跑中國等級分排行榜。年輕棋王靠智慧與勇力打下的江山似乎依然穩(wěn)固。

然而離開對局室,只往下走一個樓層,江山就變了顏色——國產(chǎn)圍棋AI“絕藝”端坐為王,成為國家隊訓練的重要輔助手段。

柯潔與連笑對決時,國手們正在用絕藝復盤訓練。“這個階段不太好過,你再怎么練,前面有一個你永遠無法達到的目標,AI一直比你更強?!狈敦菲叨?月在第15屆倡棋杯錦標賽第二輪淘汰了柯潔,但他最近的心情卻不是太好,“現(xiàn)在是AI的時代,比的是誰適應AI,使用AI,在自己身上結(jié)合得更快更好。”他指著身旁剛剛升七段的陶欣然說,“他們都適應得比我好,都長棋了,我適應得不夠快,有點兒吃虧……”

6月7日還有一個消息在著名網(wǎng)絡圍棋對弈平臺“野狐”上引爆,韓國職業(yè)棋手洪性志因“使用AI外掛被封號”——十年前洪性志擊敗李世石,晉升為七段,巔峰期剛過的李昌鎬也曾四次敗在他手下。這一次他在圍棋江湖掀動風云是因為在野狐上不可思議的17連勝,連柯潔都被他殺得十分郁悶。

網(wǎng)絡圍棋是真正的圍棋江湖,各路神仙相會于此,柯潔說自己從小到大,網(wǎng)棋下了不下兩萬盤。

AlphaGo、絕藝、金毛、星陣這些圍棋AI都是從這里起步,向金帽子(世界冠軍)銀帽子(全國冠軍)發(fā)起挑戰(zhàn),以不可思議的連勝完成自己的“成人禮”,從此在江湖立下名號。

使用AI下棋被網(wǎng)友戲稱為“遛狗”,古力驚嘆,“這對各方傷害太大了,職業(yè)棋手也要輔助下棋的話,以后誰敢在網(wǎng)上下?網(wǎng)絡圍棋改革刻不容緩了?!?/p>

“閑看數(shù)招爛樵柯,澗草山花一剎那。五百年來棋一局,仙家歲月也無多。”那個寧靜悠長、時間仿佛凝滯不動的圍棋世界,現(xiàn)在已經(jīng)被掛在線上,隨時被更新升級。“現(xiàn)在的棋跟從前已經(jīng)是兩種棋了,”國家隊總教練俞斌說AI已經(jīng)完全改變了職業(yè)棋手的行棋風格,“排名在前三四十名的棋手都受到了它的影響?!?/p>

“太快了,太快了”,李世石1比4不敵AlphaGo不過兩年,柯潔淚灑烏鎮(zhèn)也只有一年。中國圍棋隊領隊華學明摁著太陽穴直搖頭,“我原來一直認為AI進入圍棋世界是利大于弊的,現(xiàn)在……我一看到‘點三三’就頭疼,風格、美感、神秘感都沒有了,一切都改變得太快!”

江山依舊,江湖已遠。

?

讓子

如果不是研發(fā)圍棋AI“星陣”,圍棋水平僅有初學級別的計算機博士金涬恐怕一生也不會在正式比賽中與柯潔九段隔枰對坐。

?

中國圍棋國家隊訓練室,棋手用絕藝AI復盤交流學習

?

為了當好星陣的“人肉臂”,比賽前一天他特地找人陪自己擺了兩盤棋,“比賽時我下得很慢,主要是怕下錯了,電腦給出位置后,我在棋盤上反復數(shù),確認了位置才敢落子。如果因為我放錯了子而輸棋,就太對不起團隊了。”

4月27日,柯潔在福州人機大賽上對陣“星陣”,這也是0比3痛負AlphaGo之后,時隔一年他第一次與AI面對面正式分先對弈。戰(zhàn)至145手,柯潔投子認輸,星陣贏得這場人機大戰(zhàn)的勝利。

常昊九段接受本刊采訪時說,在李世石、柯潔輸給AI之后,“人機對抗的懸念已經(jīng)結(jié)束了。”這場失利也在柯潔的預料之中,面對媒體,他很平靜地說自己在中盤跟AI拼算力的時候,“力不從心”、“很無奈”。

去年5月輸給AlphaGo后,柯潔曾說自己再也不想跟AI下棋了,但那顯然只是一時血氣?!霸贏I面前,尊嚴是什么?能吃嗎?我只知道我喜歡下棋。我熱愛圍棋?!?/p>

好勝與熱愛,給了他寶貴的“一口氣”。烏鎮(zhèn)人機大戰(zhàn)之后,他對陣人類棋手連勝22場,一洗心中積郁。

當年7月,國產(chǎn)AI絕藝在野狐上以“絕藝指導棋”的名稱,與強業(yè)余選手進行二到四子的讓子棋對局,有幾位職業(yè)棋手也受二子和絕藝對局。仿佛是要給人類棋手掙回尊嚴,7月17日柯潔表示,自己可以讓職業(yè)棋手二子,當晚他與五位職業(yè)棋手對弈6局,3勝2負1和。

“職業(yè)棋手讓不動業(yè)余高手二子”,這是圍棋江湖上的一句老話?!秶逄斓亍冯s志還在職業(yè)棋手中做過一個36問的調(diào)查,其中有個問題是“如果有一個圍棋上帝,你覺得你和他的差距有多大?”棋手們答三子差距的居多,也有少數(shù)職業(yè)棋手認為圍棋上帝也讓不動自己二子。

“AlphaGo出現(xiàn)后我發(fā)現(xiàn),圍棋沒有什么不可能?!笨聺嵲谖⒉┥细帕诱f。

此后半年,即2018年1月17日晚8點半,柯潔自己也放下驕傲對戰(zhàn)“絕藝”最強版,成為首位受讓二子(黑貼六目半)與AI對弈的世界冠軍。

古力在線上看到時,眼中一熱,昔日的中國圍棋一哥給比自己小14歲的小老弟叫了聲“哥”,“一直想先去探探路,沒想到某人勇氣比我還大,厲害了我的‘哥’?!?/p>

本局僅弈77手,柯潔追殺白棋右上未果,爽快認輸。一個小時后連笑九段跟進,鏖戰(zhàn)247手后中盤告負。1月21日,“八冠王”古力也接受讓子指導,“學習一盤”。

1月24日,柯潔終于贏了一盤,用他的話說,輸了就被大肆報道,贏了,只能自己微博上通報一下,他在微博上貼出了自己寫的長文章《職業(yè)棋手與人工智能的差距》,主動談起AI,笑言兩年前那個“把熱血漫畫主角套進現(xiàn)實中、那個極度中二的圍棋少年”,如今雖然還沒到油膩的年紀,卻已經(jīng)“油膩到可以放下尊嚴去向AI虛心討教了”。

“其實聊這個話題的時候,我的內(nèi)心是極其沉重的。AI到底給了我多大的傷害——它可是唯一一個在棋盤上把我殺哭的?。 ?/p>

他直言被AI讓一手,“真的有一種說不出的滋味……苦楚?無奈?可我還是想去挑戰(zhàn)?!彼踔敛唤橐庠贏I發(fā)展到AlphaGo Zero那么強大時,去和AI下正式的讓子棋(網(wǎng)上下的都是快棋,并且行棋相對隨意,正式比賽慢棋更能代表棋手真正的水平),以此驗證最強機器智能與最強人腦智能之間的差距到底有多大。

AlphaGo Zero是AlphaGo的最終最強版本,完全擯棄了人類棋手的經(jīng)驗,從零學起,從亂下到通殺此前兩個版本,成為最強棋力的強AI,只用了40天。DeepMind方面在去年10月只發(fā)表了論文,沒有再邀約人類棋手與之對陣,它與完勝柯潔的Master版本之間勝率為89比11。

機器學習的能力和效率如此強大,“人如果還有想要跟AI決勝的想法就太愚昧了,”棋圣聶衛(wèi)平宣布,人機對抗已經(jīng)結(jié)束,“從現(xiàn)在起,是人跟機器學習的階段。”

《圍棋天地》的編輯在福州報道柯潔與星陣AI對弈時,看到一幕觸動人心的場景——

?

清早的研究室空空蕩蕩,76歲的林海峰找到人工智能“星陣圍棋”的操作人,把55年前(1963年)他與恩師吳清源第一次在循環(huán)圈中交手的棋譜輸入電腦,一步步觀看人工智能的勝率評判,細致到每一個變化圖都不錯過。

星陣給出的招法不乏人工智能特色,有些頗為奇想天外。以訥于言著稱的林海峰也不住地說,“原來還可以這樣下”,“(這一步)我下得太差了。”整整一個上午,林海峰不顧高齡坐在棋盤前一步不動,宛如聆聽大師智慧的學生。

?

窮盡

“AlphaGo去年在烏鎮(zhèn)說退出職業(yè)圍棋江湖的時候,我還以為那只是說說,沒想到此后真的再不出現(xiàn)了?!甭櫺l(wèi)平九段搖著扇子說自己很想念這個橫空出世的絕世高手。

AlphaGo去意甚堅,恰如DeepMind團隊技術負責人David Silver所言,“AlphaGo已經(jīng)退役了。這意味著我們在將人員和硬件資源轉(zhuǎn)移到其他AI的問題中,還有很長的路要走?!彪x開圍棋的日子,他們將這一智能程序所驗證的機器學習和深度學習算法應用到了能源、醫(yī)療、環(huán)境保護等多個領域。

越過山丘,傳奇退隱,圍棋江湖被打破的平靜卻再也不能恢復如常?!拔乙膊恢罏槭裁从置俺隽四敲炊郃I?”聶衛(wèi)平笑著說,“現(xiàn)在又冒出了好多‘狗’,在我心里‘阿爾法狗’是最厲害的,我想它可能找不到對手就去睡大覺了,我特別希望有一天它睡醒了,重出江湖,把這些狗狗都打敗。”

在DeepMind 發(fā)表了《Mastering the game of Go without human knowledge(不靠人類知識掌握圍棋)》的最新論文后,更多AI創(chuàng)業(yè)者闖入19×19的圍棋棋盤。星陣圍棋主創(chuàng)金涬坦言,“圍棋的數(shù)據(jù)相對來講比較好獲得,棋譜都是公開資源,做圍棋AI一來可以檢驗我們的算法鍛煉團隊,還可以快速獲得知名度和影響力,幫助我們拓展其他的客戶?!?/p>

站在巨人肩頭,一個小的技術團隊也有可能快速取得突破,柯潔輸給星陣AI一個月后,世界排名第一的韓國棋手樸廷桓又敗在天壤AI手上。

這兩個AI都是小團隊創(chuàng)業(yè),天壤智能圍棋從研發(fā)到躋身圍棋AI列強只用了一年半,星陣的崛起更令人驚嘆,它的前身是清華大學由小川教授研發(fā)的“神算子”,金涬博士和他的團隊接手僅兩個月,利用算法和模型的改變,迅速提升了棋力。與柯潔對陣前兩周,星陣AI在弈城網(wǎng)上推出30局公測,并且“奉饒?zhí)煜孪取保屜冉邮苈殬I(yè)高手的挑戰(zhàn)。

對于這個名不見經(jīng)傳的“小AI”,對弈平臺開始并沒有信心,約定如果前五局有三局失利,則測試提前結(jié)束。不料這個棋風狠辣的“小AI”28勝2負,戰(zhàn)績驚人,“星陣”的名號也迅速在棋界叫響,聶衛(wèi)平九段記不得其他AI的名字,但是說起“星陣”毫不陌生,“它下棋不退讓。”

“不退讓”是星陣圍棋AI的標簽,也是他們有意深耕于圍棋產(chǎn)業(yè)的“技術誠意”。不到兩年,國產(chǎn)圍棋AI已經(jīng)多得兩只手數(shù)不過來,也都具備了挑戰(zhàn)甚至擊敗職業(yè)九段的棋力,但其中多數(shù)都是將圍棋AI作為技術實力展示的范例,對于深度嵌入圍棋市場并沒有太大熱情——“我傷害了你卻一笑而過”,職業(yè)棋手當為之一哭也。

與AlphaGo一脈相承的是,這些“狗狗”在優(yōu)勢局面下都會無端退讓,由小川教授表示,“從對抗角度來看,能贏就是王道,但考慮到欣賞和指導層面的需求,人工智能有必要下出更容易讓人理解的圍棋,每步追求最優(yōu)下法的圍棋和能精確點目判斷的圍棋?!?/p>

星陣AI以不到AlphaGo 百分之一的計算資源,通過模型優(yōu)化、改變訓練方法,做出了一個“更接近圍棋本質(zhì)的AI”,“能贏100目,絕不贏99目。”

“雖然谷歌把它做到一個很高的水平,但是離破解這個游戲還很遠很遠,還有很多值得嘗試的地方。作為一個人工智能或者深度學習算法的實驗田來說,圍棋游戲仍然是一個很好的實驗方向?!苯饹氩┦渴菄鴥?nèi)較早從事云計算的專家。去年柯潔在烏鎮(zhèn)下棋時,他從大公司辭了職,“自己的公司還沒注冊,也還在找方向?!比藱C大戰(zhàn)是最好的AI公共教育,也掀起了AI創(chuàng)業(yè)、投資的風潮,他將谷歌的論文視為一條起跑線,大家都站在了這條線上,“在這個基礎上,可以做出自己的東西?!?/p>

他說話非常慢,氣質(zhì)與職業(yè)棋手很相近。問及公司近兩年的規(guī)劃時,他說,“哦,兩年,太長了!”見面兩天后,我從網(wǎng)上看到消息,他們與有“魔鬼道場”之稱的葛玉宏圍棋道場簽約,成為道場棋手日常訓練和殘酷的定級沖段賽的加速器。

以讓子方式與柯潔等頂級職業(yè)棋手對弈的“絕藝”挑戰(zhàn)賽版,也參考了AlphaGo Zero論文,并在實踐中作出了改進,以老版本的絕藝為基礎進行強化學習,自對弈了數(shù)百萬局棋,在有限的資源和時間內(nèi),通過把強化學習和監(jiān)督學習相結(jié)合來加速訓練,快速提升了棋力。

2017年11月,這個版本正式公開前,以“符合預期”為名隱匿身份在網(wǎng)上橫掃中日韓三國高手,39連勝時,被柯潔在第40盤以“模仿棋”阻止。棋手們一度懷疑AlphaGo重出江湖,直到第100盤,它將“絕藝如君天下少,閑人似我世間無”掛在自己的簽名檔上,并且選擇了讓兩子與老版絕藝“手談”,60連勝后公開身份,既展示了版本升級后強增兩子棋力,也是在向2017年年初Master在線上的60連勝致敬。

當晚,在滿屏打出的“666”,以及“柯潔與絕藝來盤經(jīng)典的慢棋”的呼聲中,有人打出一句,“各位,夜深了,洗洗睡去吧!”職業(yè)棋手心中況味復雜,王雷六段給《圍棋天地》雜志寫了篇《越過山丘》,“我從沒想過自己追求一生的‘道’,被一個‘硅基生命體’輕易地破解。我無法接受的是要面對被破解的狀態(tài),我無法接受的是我目前的方向只能是學習,而不是探索。作為一個對于圍棋內(nèi)在邏輯有著強烈興趣的人,我有很多很多不能接受。”

?

亂局

無論是否情愿,處于競技圍棋之巔的中韓國手都在這一年里擁抱了技術變革,爭先恐后。

今年5月,韓國圍棋小王子、18歲的申真谞在第23屆GS杯決賽五番棋決勝局戰(zhàn)勝李世石九段,獲得了一個分量極重的國內(nèi)冠軍。接受韓國媒體采訪時,他毫不諱言自己師從AI,“現(xiàn)在人工智能幾乎否定了迄今所有的圍棋理論,所以我們必須擯棄現(xiàn)有的圍棋理論。以往的定式,只是表現(xiàn)那種條條框框的變化,而現(xiàn)在棋盤上沒有什么是‘已經(jīng)確定’的。無論中盤戰(zhàn)斗還是布局,現(xiàn)在都是隨機萬變?!?/p>

韓國國家隊研究室安裝了ELF OpenGo,這個AI是Facebook團隊參照論文對DeepMind技術的一個重現(xiàn),由于韓國本土沒有強圍棋AI,韓國棋院積極配合Facebook AI團隊,金志錫、申真谞、樸永訓及崔哲瀚四位世界排名前30的選手都參與了ELF框架的測試改善,測試結(jié)果對外公布后,職業(yè)棋手們再次捂住胸口——AI每步限制50秒搜索時間,給人類棋手任意長時間思考,據(jù)稱一些棋局下了三四個小時,結(jié)果AI仍然14比0完勝。

申真谞說自己每天至少要花五個小時以上和AI實戰(zhàn)或者研究棋譜,“人工智能始終能下出閃光的一手棋,雖然無法完全理解透,但其思路能給你帶來靈感。”

戰(zhàn)績起伏的柯潔則稱自己在“重新學習圍棋”。

“絕藝”4月底正式進入中國圍棋隊訓練室,成為國家隊訓練專用AI,古力特意發(fā)了一條微博,“國家隊的訓練方式跟上了時代的步伐?!迸c騰訊方面的溝通都是華學明領隊去談的,拿到密碼時,她召集總教練俞斌和女隊教練王磊商議,國家隊的凝聚力不能散,不能人人抱著臺電腦,“密碼我們拿著,棋手必須到訓練室來使用AI,中國圍棋隊集體討論的傳統(tǒng)不能丟?!?/p>

“絕藝的作用很大,過去我們爭論不休,誰也說服不了誰的局部,AI全部給出數(shù)字,這個是棋手最需要的,”俞斌教練把AI的使用比作“指路明燈”,他預言競技圍棋格局將發(fā)生變化,中國隊有望真正與韓國拉開差距,而日本以及歐美“競技圍棋沙漠”有可能借助AI獲得突破性提升,“韓國沒有我們這么強的AI,技術上的支持和便利也不如我們。日本追不上中韓,但是如果AI用得好,他們的成績可以快速提升,大賽進入16強或者32強不會那么困難了。”

對“道”的渴求,讓職業(yè)棋手可以放下驕傲,在AI的幫助下接近“圍棋上帝”,然而AI尚未窮盡棋道,上帝未來,撒旦先至。

前不久在浙江麗水舉行的2018全國業(yè)余圍棋公開賽上一位棋手疑似使用人工智能作弊,他將自己的手機一直放在上衣口袋、攝像頭對準棋盤,爆冷戰(zhàn)勝“業(yè)余天王”胡煜清8段后賽事方要求他收起手機,此后的比賽他不復神勇。

中國棋院早在2017年11月1日就頒布了《圍棋職業(yè)比賽補充規(guī)定》,核心內(nèi)容便是“鑒于圍棋人工智能的發(fā)展速度”,職業(yè)棋手比賽中禁止攜帶、觀看手機及其他電子設備,一經(jīng)發(fā)現(xiàn)立即判負。“午休時間由一小時縮減為半小時,包括午休時間在內(nèi),對局棋手一律禁止回房間。如因特殊情況必須返回房間的,須有當值裁判陪同?!?/p>

柯潔此前曾經(jīng)說過,職業(yè)棋手使用AI作弊的可能性較小,“圈子很小,這么做會讓人看不起。”6月7日洪性志因“遛狗”被野狐封號之后,職業(yè)棋手之間的網(wǎng)上對弈也不安心了,當真是沒有人知道你對面是不是坐著一只狗。

有專業(yè)人士預測,今后的職業(yè)大賽都將取消封盤制,拉通下。而日本圍棋界的兩日制對局勢必退出江湖,“第一天比賽后,如果當局者利用AI來判斷局勢,尋找下一手最佳落點的話,對手還怎么下?”

“我們最開始學圍棋的時候,都是日本風格,后來越來越競技化,”談及可能發(fā)生的變化以及無法預料的更多變化,華學明領隊輕嘆一聲,“一切來得太快了!”

盡管跟華學明一樣,看不得棋手不明所以地“點三三”,“像一陣流行感冒一樣。”聶衛(wèi)平還是以他一貫的樂觀通達將AI的出現(xiàn)視為“圍棋推廣的福音”,但他也看到這一代棋手的艱難,“棋手要真正理解、消化AI的判斷,形成自己的棋路,不容易,會是一條長路。”

舊有經(jīng)驗失效,自我價值動搖,在AI侵入圍棋這個故事里,百味雜陳的不只是職業(yè)棋手,永遠沉默永遠面無表情的AlphaGo“人肉臂”黃士杰博士2017年11月在臺灣出席人工智能研討會,首度開腔,分享了在AlphaGo Zero版本的研發(fā)中,自己被強大的AI取代的感受——

?

DeepMind 把所有人類圍棋知識拋棄掉,只給規(guī)則讓它從頭開始學。我回想起我在師大念博士班開發(fā)Erica圍棋電腦程序,每天寫程序、解Bug、做測試到半夜的日子,但AlphaGo Zero把我之前做的這些事全部取代,完全不需要我的協(xié)助。

于是有同事問我,AlphaGo Zero把你過去十幾年在計算機上做的研究一點一點的拿掉,還遠遠超越你,你有什么感覺?一開始我心情有點復雜,但后來想想這是“趨勢”。??

如果我讓 AlphaGo 有所阻礙的話,那我確實應該被拿掉,AlphaGo 99%的知識經(jīng)我之手,它到達這一步其實是我從事計算機圍棋研究的非常好的收尾,我已經(jīng)非常滿足了。

?

黃博士目睹AlphaGo Zero用了2000個TPU、自我訓練了40天。第40天還沒有到達其極限,“因為我們的機器要做其他事情就停下了,它還有很大的潛力?!?/p>

計算機專家吳軍博士在《智能時代》中寫道,“智能革命的結(jié)果是讓計算機代替人去思考,或者說靠計算能夠得到比人類思考更好的結(jié)果,能夠更好地解決各種智能問題,這時,人類會突然發(fā)現(xiàn)自己還能做得比計算機更好的事情已經(jīng)所剩不多了?!?/p>

我們持續(xù)跟蹤報道職業(yè)棋手與AI相遇的故事,是因為對于其他專業(yè)領域而言,這個故事是樣本也是鏡鑒。

即便你是一個技術樂觀派,贊同黃博士所言,“未來AI是人類的工具,跟人類合作,而非跟人類對抗。強人工智能還是Far Away,現(xiàn)在最強的學習技能仍在人類的腦袋里。”我們?nèi)匀灰匦麓蛄孔约汉退诘男袠I(yè),技術席卷而至,我們能夠持守的根基是什么?

(實習記者劉芮對本文亦有貢獻)

?

網(wǎng)友評論

用戶名:
你的評論:

   
南方人物周刊 2024 第810期 總第810期
出版時間:2024年10月21日
 
?2004-2022 廣東南方數(shù)媒工場科技有限責任公司 版權所有
粵ICP備13019428號-3
地址:廣東省廣州市廣州大道中289號南方報業(yè)傳媒集團南方人物周刊雜志社
聯(lián)系:南方人物周刊新媒體部