3月9日,曾18次獲得圍棋世界冠軍的南韓圍棋九段棋手李世石與Google旗下Deepmind公司研發的人工智慧程式 AlphaGo在首爾四季酒店開始對弈,結果第一局由AlphaGo勝出,之後四局將於10日至15日分別舉行,Deepmind的Youtube頻道均會進行現場直播。
這場被譽為「人機對決」的圍棋比賽將以五局三勝制進行。雙方按此前約定,採用中國規則、黑貼3又3/4子。即使一方首先取得三勝,也會全部下完五局,而最終勝方可獲得100萬美元奬金;假如勝方全勝5局,更可額外多獲25萬美元奬金。
首局對奕歷時近4個小時。開局時,AlphaGo下子小心翼翼,但進入中局,明顯變得進取,甚至棋行險著。為 Deepmind擔任直播評論的九段棋手Michael Redmond指 ,AlphaG相比去年10月攻敗歐洲圍棋冠軍樊麾時,技術又有明顯進步,犯錯更少。
有分析指,由於人工智慧的表現比較穩定,第一局已能反映其到能到達的水準,因此透過第一局的勝負已大概能預測到最終戰果。
「我相信這不會是一場旗鼓相當的比賽,估計(最後比分)是5-0或4-1。對我來說,關鍵是一場都不會輸......和機器比賽跟人類有很大差異,假如對手是人,你會感受到對方的呼吸、精神,很多時你會基於一些身體反應而做決定,但對手是機器就沒有這些參考了。」南韓圍棋九段棋手李世石在賽前說。
李世石現年33歲,是當今世界三大圍棋高手之一,出道之初以棋風銳利、擅長大規模攻殺見稱。近年他的棋風更加成熟,在多次世界圍棋大賽中,他均在開始落後的情況下最終逆轉勝出。
李世石的對手是Google旗下Deepmind公司研發的人工智慧程式AlphaGo。去年10月, AlphaGo曾以5局全勢的姿態,擊敗3屆歐洲圍棋冠軍、二段棋手樊麾。
《自然》雜誌於今年1月刊登的文章解釋,AlphaGo在蒙地卡羅樹搜索中同時採用2個深度神經網絡,分別是選擇下子的策略神經網絡(Policy Network)及評估選點的價值神經網絡(Value Network);前者負責計算每步棋的走法,後者則負責「想像」、推算可能出現的局面,讓AlphaGo能高度模擬人腦在下圍棋時憑直覺快速鎖定策略的思維邏輯。此外,工程師們為Alpha上載了圍棋高手們超過3000萬步的棋步,並讓價值神經網絡進行了高達2000萬次自我對局的訓練,最終才讓AlphaGo走上比賽桌。
本文獲端傳媒授權轉載