Anthropic呼籲建立更貼近現實的人工智慧評估標準
品玩 / 洪嘉鎂編譯
2024-07-02 18:30

據 Siliconangle 報導,Anthropic 宣布啟動一項新計畫,鼓勵研究人員創造新的產業基準,以更好地評估人工智慧的表現和影響。

Anthropic 解釋說,他們願意向任何能夠提出更好的方法來「衡量人工智慧模型的先進能力」的第三方組織提供資助。

Anthropic 的倡議源於對現有人工智慧模型基準測試越來越多的批評,比如非營利實體 MLCommons 每年進行兩次的 MLPerf 評估。普遍認為,用於評定人工智慧模型的最流行基準在評估一般人日常如何實際使用人工智慧系統方面做得很差。

Anthropic 希望鼓勵人工智慧研究界提出更具挑戰性的基準,重點關注其社會影響和安全性。它呼籲對現有方法進行徹底改革。

本文為品玩授權刊登,原文標題為「Anthropic 啟動新計劃,資助創建更可靠的人工智慧基準