重新認識特斯拉!原來是一家運算公司
駱軼航 / 何渝婷編譯
2021-09-09 14:30

拋開馬斯克的自我造神,是時候重新認識特斯拉了。

在特斯拉的官網上,它宣稱自己是一家電動車、太陽能和清潔能源公司。在一些人眼中,因為備受爭議但持續演進的自動駕駛技術,特斯拉是一家人工智慧公司。在不久前特斯拉舉辦的首次AI Day上,因為一款酷似人形的機器人Tesla Bot的問世,不少人開始認為特斯拉是一家機器人公司。

而馬斯克經常說的一句話是:「特斯拉是一系列新創公司的集合。」

然而在AI Day上,特斯拉透露出的真正訊號是:這是一家運算公司。

「運算公司」(Computing Company)看上去是一個大而無當的概念,尤其在這個遍地都是「算法」的互聯網世界裡。然而,算法更多的是一個軟體概念,它是基於一定數據結構的數據,輸入產生的新輸出結果。而除了數據和算法,構成「運算」的更核心部分是「算力」,也就是一部運算設備,無論是一台超級電腦、一部智慧型手機還是一輛智慧網聯汽車的數據處理能力。它在很大程度上是硬體的能力,也就是晶片和運算模塊的能力,這才是「運算」的本質。

從這個意義上說,一些充分掌握人工智慧「算法」而未掌握核心「算力」的公司,並不能被稱作是一家「運算公司」,比如開發了今日頭條、抖音和TikTok的字節跳動,就還不能被稱作是一家運算公司。在美國,英特爾、AMD和輝達,都是稱得上是老牌的運算公司,蘋果和谷歌是新晉的計算公司。抱歉,亞馬遜和臉書還不是運算公司。

現在,「運算公司」的名單裡,多了一個特斯拉。

比起看上去神乎其神的機器人Tesla Bot,特斯拉在AI Day上發表的「D1」晶片和超級電腦平台「Dojo」,才是真正的重頭戲:它意味著特斯拉像蘋果那樣,具備了把整個生態從上游到下游,都掌控在自己手裡的基礎能力。

「D1」是一款AI訓練晶片,當然也是一款運算晶片。它採用7奈米工藝,單片FP32達到算力22.6TOPs,BF16算力達到262TOPs。根據特斯拉的演示,單顆D1晶片的神經網路算力超過一塊顯卡,也就是說特斯拉D1比輝達的GPU和谷歌的TPU性能都強。特斯拉自動駕駛硬體高級總監、Dojo項目負責人Ganesh Venkataramanan說,D1完全是由特斯拉團隊自主設計的晶片,從架構到封裝,該晶片就像一個GPU,但又具有CPU級別的靈活性和兩倍於網路晶片級別的上傳/下載頻寬。所以,D1晶片既不是一款CPU,也不是一款GPU,而被直接稱作「Pure Learning Machine(純學習機器)」。

一顆顆D1晶片的無縫連接,構成了一個25顆D1晶片組成的機器學習模塊,再把多個模塊集成在一起,就構成了一台特斯拉自研的超級電腦Dojo。Dojo的日語譯文是「道場」,也就是修煉的地方。「修煉」的意象正符合一台超級電腦最核心的功能,就是對數據模型無休無止的機器學習和神經網路訓練,煉成一顆超級大腦。

Dojo有超過50萬個訓練節點,每個節點的算力為9千兆浮點計算(fetaflops)。基於Dojo的架構,特斯拉又發表了ExaPOD,集成了120個訓練模塊,包含3000顆D1晶片,超過100萬個訓練節點,算力超過1100千兆浮點運算。特斯拉說,這就是全球最快的AI訓練電腦。作為一家非常喜歡用「概念替換」的方式,無限放大自身優勢的公司,特斯拉甚至想宣稱,這已經是全球性能最強的超級電腦。

然而作為一款神經網路訓練為主要功能的電腦,特斯拉的「千兆浮點計算」指向的其實是低精度算力,而非超級電腦性能的通常參考值雙精度浮點算力。按照後者性能計算,特斯拉Dojo的排名大約在世界第七,落後於日本的富岳(Fugaku)、美國的IBM Summit、美國的Sierra、中國的神威太湖之光、美國的Selene和中國的天河2-A。特斯拉說,Dojo的性能下一代還會有10倍的提升,依據這家公司的歷史,很難排除其中的「吹牛」成分,但特斯拉的一個「優勢」在於,比起人工智慧領域遍地存在的「吹牛不上稅」的玩家,它總能把事情做得更到位。

Dojo這個號稱世界上最強的神經網路訓練電腦,將被專注用來做一件事,訓練特斯拉完全基於純視覺而非雷射雷達的自動駕駛。鑒於特斯拉在全球有幾百萬輛行駛在高速公路上的轎車,這是一項有著海量數據支撐的實驗。特斯拉AI技術負責人Andrej Karpathy,在AI Day上解釋了Dojo這台超級電腦對純視覺自動駕駛的意義,一輛特斯拉轎車上的8個攝影鏡頭能夠檢測足夠多的圖像數據和預期目標,但背後的神經網路矢量空間不夠。於是,特斯拉基於Dojo運算平台重新設計了神經網路系統,作為自動駕駛系統的決策依據。

也就是說,過去特斯拉的自動駕駛眼睛好使,但腦子還是不夠用(不知道這是不是自動駕駛剎車系統經常出bug的原因)。現在,特斯拉重新給了每一輛車一個新的大腦。

這是「算力」的力量,只有一家「運算公司」才能真正地做到這一點。它讓特斯拉基於純視覺方案的、將自動駕駛系統看作一個眼睛、神經和大腦的結合體的解決方案,得以在蔚來、小鵬和理想們「攝影鏡頭+雷射雷達」的包圍中,孤注一擲地走下去。Dojo這台超級電腦能不能真正地修煉出一顆比雷射雷達厲害的「超級大腦」,雖有待時間的檢驗。但其背後關於從晶片到模塊再到超級電腦,從硬體到軟體的一整套圍繞著「運算」而投入的巨大成本,讓特斯拉的本質從一家「電動車和太陽能公司」跳了出來。

一直看好並加碼投資特斯拉的基金管理公司ARK,其分析師Frank Downing認為特斯拉的Dojo類似一個「復合大腦」(Synthetic Brain),它鍛造的是一個被超級算力驅動的、基於海量數據的神經網路訓練的超級大腦。

我覺得它或許可以類比谷歌的「Google Brain」,它們的區別在於,谷歌的大腦更多地用於在內容、廣告和資訊上的「通用人工智慧」(AGI, Artificial General Intelligence)訓練,而特斯拉Dojo當然優先用於自動駕駛系統的訓練。而且,從晶片到運算模塊再到超級電腦的算力上,Google的TPU確實遜色很多了。

ARK的分析師Frank Downing還提出了一個有意思的觀點,不要盯著特斯拉那個能說會跳、身高172公分的機器人不放,特斯拉當然有可能做機器人,但更重要的是,Dojo給特斯拉帶來的運算能力和大腦,將推著特斯拉走向「通用人工智慧」(AGI)的未來。

馬斯克說Tesla Bot能幫助人類從事一些危險而重複的體力勞動。只不過,它長得過於像人類這一點,仍然不免讓它更像是一個噱頭,真正能替代人類從事危險重複體力勞動的機器人,長得不需要像人,過度的「擬人化」只會束縛而不會解放一個機器人的生產力。但是,它背後的邏輯卻是清晰的,特斯拉認為自動駕駛的優勢在於大部分人其實不擅長駕駛這件事,那一輛自動駕駛的電動轎車,又何嘗不是在替代大多數人類從事危險而重複的體力勞動呢?

「替代人類勞動」這件事,是通用人工智慧的必要性所在,而那些真正通盤掌握了從算力到數據再到算法的運算公司,而非簡單的人工智慧公司,無疑是更有話語權的。

本文為品玩授權刊登,原文標題為「重新認識特斯拉:一家計算公司