擊敗AlphaGo Zero!4點認識AI新棋王AlphaZero
Knowing
編輯部 2017-12-07 15:45

由英國倫敦Google DeepMind所開發的人工智慧圍棋程式AlphaGo,不僅擊敗頂尖職業棋士李世乭,也在今年五月擊敗中國棋王柯潔,而在沒有人類對手後,Deepmind 創辦人也宣布AlphaGo退役;不過DeepMind在圍棋上的探索尚未停止。

 

今年十月,AlphaGo的團隊推出以零自學的AlphaGo Zero,並以 100:0 擊敗了之前版本的 AlphaGo。而不到五十天,該團隊又再度發表論文,提出通用棋類人工智慧程式的AlphaZero。

 

去掉了「GO」

 

最新推出的AlphaZero拿掉了原先AlphaGo Zero的代表圍棋的「GO」,就是因為AlphaZero不僅圍棋下得比之前的版本都好,連國際象棋、日本將棋它也能下;而名字中的「Zero」則同樣代表從零自學。

 

從零開始進行強化學習

 

AlphaZero是AlphaGo Zero的通用進化版本,不僅保持了AlphaGo Zero利用深度網絡從零開始進行強化學習的特點,它也會過更新網路參數,減少網路估計比賽結果與實際結果間的誤差。

 

8小時擊敗第一代AlphaGo

 

AlphaZero在除了基本規則下從零開始訓練,驚人的是,AlphaZero不僅在4小時打敗國際象棋最強程序Stockfish,在8小時也擊敗了曾大勝南韓棋王李世乭的AlphaGo,此外,AlphaZero在訓練34小時後,也勝過了訓練72小時的AlphaGo Zero

 

盼能利用在重大醫療問題

 

AlphaZero的出現代表著AI 技術不僅只能為玩遊戲而設定,根據《蘋果日報》報導,DeepMind希望最終能利用AlphaZero運算法解決重大醫療問題,他們相信,人們數百年都研究不出的疾病療法,該程式可能在數日或數周內研究出來。