OpenAI重磅研究：ChatGPT可能影響80%工作崗位，收入越高影響越大

（取自OpenAI臉書粉專）

ChatGPT 的影響涵蓋所有收入階層，且高收入工作可能面臨更大的風險。

ChatGPT 來了，失業還會遠嗎？

上星期在 GPT-4 發表時，ChatGPT 第一時間上線了新版本，OpenAI 執行長 Sam Altman 表示他對自家這種技術「有點害怕」。

和很多專家一樣，Altman 擔心人工智慧技術的強大能力會製造過多虛假資訊，另一方面，新技術也將改變經濟、勞動力和教育環境。

有人開玩笑說 Sam Altman 每天背著的同一個包，裡面有緊急關停 AI 的紅色按鈕。

此前，AI 作畫已經讓很多畫師開始擔憂自己的工作會被取代。

昨天，OpenAI 研究人員提交的一篇報告引發了人們更加熱烈的討論，研究人員估計 ChatGPT 和使用該程式建構的未來應用可能影響美國大約 19% 的工作崗位，和他們至少 50% 的工作任務。

與此同時，80% 的美國勞動力至少有 10% 的工作任務在某種程度上將受到 ChatGPT 的影響。

該研究分析表明，像 GPT-4 這樣的 LLM（大型語言模型）的影響可能是無處不在的。

此外，薪資較高的工作，可能需要執行許多基於軟體的任務，會面臨更多來自人工智慧聊天機器人的潛在影響。

在職業影響方面，受影響最大的職業包括翻譯工作者、作家、記者、數學家、財務工作者、區塊鏈工程師等。

該研究還按產業細分了 ChatGPT 的影響，包括數據處理托管、出版業等產業最有可能受到影響。

相比之下，體力勞動較多的產業，包括食品、林業、社會援助等受到的潛在影響最小。

OpenAI 研究了美國超過 1000 個職業，並給他們貼上了執行這些工作所需的各種任務的標籤。

然後，研究人員使用人工注釋器和 GPT-4 模型來評估訪問由 ChatGPT 驅動的系統，是否會將人類執行特定任務所需的時間減少至少 50%。

讓我們看看這項研究具體在幹什麼：

研究介紹

我們先看總結，OpenAI 本次調查了 GPT 模型和相關技術對美國勞動力市場的潛在影響，他們根據人員職業與 GPT 能力的對應程度來進行評估，研究結果表明，大約 80% 的美國勞動力至少有 10% 的工作任務會受到 GPT 的引入影響，而大約 19% 的員工可能會看到至少 50% 的工作任務受到影響。

這種影響涵蓋所有薪資水準，高收入工作可能面臨更大的風險，值得注意的是，這種影響不僅限於近期生產率成長較高的產業。

通過分析他們發現，像 GPT-4 這樣的大型語言模型帶來的影響可能是普遍的，隨著時間的推移，LLM 的能力不斷提高，即使現在研究人員停止對新模型能力的開發，但它們帶來日益成長的經濟效應也會持續成長。

該研究還發現，如果考慮到互補技術的發展，LLM 的潛在影響將顯著擴大，這也恰恰說明了 GPT 正變得越來越通用。

為了分析，該研究還提出了一個新的標準來理解 LLM 的能力及其對工作潛在影響，該標準用來衡量關於 GPT 任務的總暴露數。

看完結論，接下來就該介紹數據集了。

該研究使用 O*NET 27.2 數據集 (O*NET, 2023)，該數據集包含 1016 個職業資訊，表 1 提供了數據集示例，包含任務 ID、職位等。

此外，數據集還包括他們從美國勞工統計局獲得的 2020 年到 2021 年員工就業和薪資數據，該數據集包括職業頭銜、每種職業的工人數量等。

在方法上，該研究根據 exposure rubric 來展示結果，Exposure rubric 定義為訪問 GPT 或 GPT 驅動的系統是否會將人類執行特定 DWA 或完成任務所需的時間減少至少 50%。（注：DWA 全稱 Detailed Work Activities ，可以將其理解為完成任務所需要的動作，例如表 1，對於電腦系統工程師，其 DWA 包括監控電腦系統性能，確保正常運作。）

該研究對每個 O*NET 數據集的 DWA 和所有 O*NET 任務的子集獲得人工注釋，然後在任務和職業級別上匯總這些 DWA 和任務得分。

為了確保這些注釋的品質，該研究親自標記了大量任務和 DWA 樣本，並招募了經驗豐富的人工注釋者，他們在 OpenAI 的對齊工作中廣泛審查了 GPT 輸出。

下表為模型與人的一致性比較與皮爾遜相關係數，一致性分數是通過觀察兩組人在注釋上達成一致的頻率來確定的 (例如 E0, E1 或 E2)，在本文中，該研究使用 GPT-4, Rubric 1。

該研究為感興趣的因變量構建了三個主要度量：(i) 𝛼，對應於上面 exposure rubric 中的 E1， (ii) 𝛽，是 E1 和 0.5*E2 的總和，以及 (iii) 𝜁，E1 和 E2 的總和。該研究在表 2 中總結了注釋組和度量之間的一致性。

研究結果

OpenAI 的這項研究以 GPT 語言模型對經濟具有普遍影響作為假設，我們來看一下具體的研究結果。

下表 3 是人類和 GPT-4 模型的總體 exposure 數據，其中，人類和 GPT-4 的數據表明平均 occupation-level 𝛼 值介於 0.14 和 0.15 之間，這表明對於中等職業，大約 15% 的任務直接受到 GPT 影響。

對於 𝛽，這個數字增加到 30% 以上，對於 𝜁，這個數字則超過 50%。

根據 𝛽 值，該研究估計 80% 的人屬於至少一項工作任務受 GPT 影響的職業，而 19% 的人所處的職業有超過一半的工作任務被標記為受到 GPT 影響。

薪資和就業

下圖 3 描繪了 GPT 模型對經濟的整體影響。

下圖 4 描繪了工作薪資與對 GPT 等語言模型接觸使用情況的關係。

然後，該研究又從不同的職業分類探究了 GPT 模型的影響，包括 ONET 數據庫中的 5 個 Job Zone，其中，Job Zone 1 中的工作入職要求最低，Job Zone 5 則最高。

總體來說，OpenAI 這項研究發現，工作對科學方法和批判性思維的依賴程度與 LLM 接觸使用情況呈負相關，而編程和寫作技能與 LLM 接觸使用呈正相關。

不過，該研究也承認，試圖通過使用簡單的標籤來描述工作任務並代表每個職業，這種方法本身存在固有的偏見，並且可能忽略了一些特有的技能或任務。

當然，還有一個非常重要的問題是 GPT 模型目前仍存在很多缺陷，包括編造虛假資訊，這使得人工監督工作成為必要。

大模型的廣泛應用，或許意味著許多人將失去工作，但 OpenAI 執行長 Sam Altman 認為這也將是個找到更好工作的機會：「我們可以擁有更高的生活品質，同時，人們需要時間來更新、做出反應、習慣這項新技術。」

本文為巴比特授權刊登，原文標題為「OpenAI重磅研究：ChatGPT可能影響80%工作崗位，收入越高影響越大」