Anthropic呼籲建立更貼近現實的人工智慧評估標準

Anthropic呼籲建立更貼近現實的人工智慧評估標準

品玩 / 洪嘉鎂編譯

2024-07-02 18:30

據 Siliconangle 報導，Anthropic 宣布啟動一項新計畫，鼓勵研究人員創造新的產業基準，以更好地評估人工智慧的表現和影響。

Anthropic 解釋說，他們願意向任何能夠提出更好的方法來「衡量人工智慧模型的先進能力」的第三方組織提供資助。

Anthropic 的倡議源於對現有人工智慧模型基準測試越來越多的批評，比如非營利實體 MLCommons 每年進行兩次的 MLPerf 評估。普遍認為，用於評定人工智慧模型的最流行基準在評估一般人日常如何實際使用人工智慧系統方面做得很差。

Anthropic 希望鼓勵人工智慧研究界提出更具挑戰性的基準，重點關注其社會影響和安全性。它呼籲對現有方法進行徹底改革。

本文為品玩授權刊登，原文標題為「Anthropic 啟動新計劃，資助創建更可靠的人工智慧基準」

Knowing

【專訪】穩定幣監管不能裸奔！金融派大星温宏駿：台灣應先穿衣、再出征

【張瑞雄專欄】人工智慧代理人的潛能與風險

AI農業進行式！數據耕作時代來臨，AI型農智慧耕耘座談會今於高雄盛大舉辦

【專訪】RWA議題正熱！警政署165專線秘書莊明雄：RWA很有可能成為下一個熱門詐騙標的

美參院通過《GENIUS法案》、Circle成功IPO！學者直言穩定幣「監管淘汰賽」將到來

超夏泡泡趴來了! 2025鹽琉開趴新園海洋航運園區盛大舉辦

Circle上市三天股價火燙，海耶克科技共同創辦人暨商務長温宏駿：關鍵原因在於其為The one and only！Paxos後勢看漲有望成為Circle最大競爭對手

【專訪】成為詐騙守門員！STARBIT暨Jcard執行長鄧萬偉：20億筆標籤庫就是我們協助防詐的底氣