「AI世界」還缺什麼?牛津大學教授Michael Wooldridge:現實世界
學術頭條 / 何渝婷編譯
2022-10-06 15:58

(示意圖/取自pixabay)

無限猴子定理認為,讓一隻猴子在打字機上隨機地按鍵,當按鍵時間達到無窮時,幾乎必然能夠打出任何給定的文字,比如莎士比亞的全套著作。

在這個定理中,「幾乎必然」是一個有特定含義的數學術語,「猴子」也不是指一隻真正意義上的猴子,而是被用來比喻成一台可以產生無限隨機字母序列的抽象設備。

這個理論說明,把一個很大但有限的數看成無限的推論是錯誤的,即使可觀測宇宙中充滿了一直不停打字的猴子,它們能夠打出一部《哈姆雷特》的概率仍然少於 1/10^183800。

而且,即使給無數隻猴子無限的時間,它們也不會懂得如何欣賞吟遊詩人詩意的措辭。

「人工智慧(AI)也是如此。」 牛津大學電腦科學教授Michael Wooldridge這樣說道。

在Wooldridge看來,雖然GPT-3等AI模型借助數百億或數千億的參數,展現出了令人驚訝的能力,但它們的問題不在於處理能力的大小,而在於缺乏來自現實世界的經驗。

例如,一個語言模型可能會很好地學習「雨是濕的」,當被問及雨是濕的還是乾的時,它很可能會回答雨是濕的。

但與人類不同的是,這個語言模型從未真正體驗過「潮濕」這種感覺,對它們來說,「濕」只不過是一個符號,只是經常與「雨」等詞結合使用。

然而,Wooldridge也強調,缺乏現實物理世界知識並不能說明AI模型無用,也不會阻止某一AI模型成為某一領域的經驗專家,但在諸如理解等問題上,如果認為AI模型具備與人類相同能力的可能性,確實令人懷疑。

相關研究論文以「What Is Missing from Contemporary AI? The World」為題,已發表在《智慧運算》(Intelligent Computing)雜誌上。

在當前的AI創新浪潮中,數據和算力已經成為AI系統成功的基礎,AI模型的能力直接與其規模、用於訓練它們的資源以及訓練數據的規模成正比。

對於這一現象,DeepMind研究科學家Richard S. Sutton此前就曾表示,AI的「慘痛教訓」是,它的進步主要是使用越來越大的數據集和越來越多的運算資源。

在談及AI產業的整體發展時,Wooldridge給出了肯定。「在過去15年裡,AI產業的發展速度,特別是機器學習(ML)領域的發展速度,一再讓我感到意外,我們不得不不斷地調整我們的預期,以確定什麼是可能的,以及什麼時候可能實現。」

但是,Wooldridge卻也指出了當前AI產業存在的問題,「儘管他們的成就值得稱讚,但我認為當前大多數大型ML模型受到一個關鍵因素的限制,AI模型沒有真正體驗過現實世界。」

在Wooldridge看來,大多數ML模型都是在電子遊戲等虛擬世界中建構的,它們可以在海量數據集上進行訓練,一旦涉及到物理世界的應用,它們就會丟失重要資訊。

它們只是脫離實體的AI系統,以支持自動駕駛汽車的人工智慧為例,讓自動駕駛汽車在道路上自行學習是不太現實的,出於這個和其他原因,研究人員們往往選擇在虛擬世界中構建他們的模型。

「但它們根本沒有能力,在所有最重要的環境(即我們的世界)中運行。」Wooldridge 說道。

另一方面,語言AI模型也會受到同樣的限制。可以說,它們已經從荒唐可怕的預測文本演變為Google的LAMDA,今年早些時候,一個前Google工程師聲稱人工智慧程式LAMDA是有知覺的,一度成為了頭條新聞。

「無論這個工程師的結論的有效性如何,很明顯LAMDA的對話能力給他留下了深刻的印象,這是有充分理由的。」Wooldridge說,但他並不認為LAMDA是有知覺的,AI也沒有接近這樣的里程碑。

「這些基礎模型展示了自然語言生成方面前所未有的能力,可以生成比較自然的文本片段,似乎也獲得了一些常識性推理能力,這是過去60年中AI研究的重大事件之一。」這些AI模型需要海量參數的輸入,並通過訓練來理解它們。

例如,GPT-3使用互聯網上千億級的英語文本進行訓練,大量的訓練數據與強大的運算能力相結合,使得這些AI模型表現得類似於人類的大腦,可以越過狹窄的任務,開始辨識模式,並建立起與主要任務似乎無關的連結。

但是,Wooldridge卻表示,基礎模型是一個賭注,基於海量數據的訓練使得它們在一系列領域具備有用的能力,也進而可以專門用於特定的應用。

「符號人工智慧(symbolic AI)是基於『智慧主要是知識問題』的假設,而基礎模型是基於『智慧主要是數據問題』的假設,在大模型中輸入足夠的訓練數據,就被認為有希望提高模型的能力。」Wooldridge認為,為了產生更智慧的AI,這種「可能即正確」(might is right)的方法,將AI模型的規模不斷擴大,但忽略了真正推進AI所需的現實物理世界知識。

「公平地說,有一些跡象表明這種情況正在改變。」Wooldridge說。

今年5月,DeepMind宣布了基於大型語言集和機器人數據的基礎模型Gato,該模型可以在簡單的物理環境中運行。

「很高興看到基礎模型邁出了進入物理世界的第一步,但只是一小步,要讓AI在我們的世界中工作,需要克服的挑戰至少和讓AI在模擬環境中工作所面臨的挑戰一樣大,甚至可能更大。」在論文的最後,Wooldridge這樣寫道:「我們並不是在尋找AI道路的盡頭,但我們可能已經走到了道路起點的盡頭。」

本文為品玩授權刊登,原文標題為「「AI世界」還缺點啥?牛津大學教授Michael Wooldridge:現實世界