研究:AI公司面臨訓練數據枯竭危機,高品質數據將在2026年前耗盡
東尋 / 何渝婷編譯
2023-11-14 11:55

(示意圖/取自pixabay)

根據《站長之家》 11 月 14 日報導,澳洲麥覺理大學的資訊技術法學教授 Rita Matulionyte 在《對話》雜誌的一篇文章中指出,AI 研究人員近一年來一直在敲響數據供應告急的警鐘。

根據去年 Epoch AI 人工智慧預測組織的一項研究,AI 公司可能在 2026 年前耗盡高品質文本訓練數據,而低品質文本和圖像數據的枯竭時間,可能介於 2030 年至 2060 年之間。

對於數據飢渴的 AI 公司來說,使用由 AI 模型生成的合成數據進行訓練可能並非可行的解決方案。

研究表明,訓練 AI 模型使用 AI 生成的內容可能導致模型內在的畸形效應,使輸出變得混亂和怪異,面對這一潛在問題,除非出現大規模人類內容農場,否則解決方法可能在於建立數據合作夥伴關係。

這意味著擁有豐富高品質數據的公司或機構與 AI 公司達成協議,交換數據以換取資金。

本文為AI新智界授權刊登,原文標題為「研究:AI 公司面臨訓練數據枯竭危機,高質量數據將在 2026 年前耗盡