LMSYS Org更新基準測試報告，Claude-3超越GPT-4

LMSYS Org更新基準測試報告，Claude-3超越GPT-4

品玩 / 何渝婷編譯

2024-03-28 18:05

LMSYS Org 近日公布最新基準測試報告，Claude-3 得分以微弱優勢超越 GPT-4，成為該平台「最佳」大語言模型。

根據LMSYS Org 旗下的基準測試平台 Chatbot Arena顯示，Anthropic 的 Claude 3 Opus 以 1253 比 1251 的微弱優勢擊敗了 GPT-4，OpenAI 的 LLM 被擠下了榜首位置。

由於比分過於接近，出於誤差率方面的考量，該機構讓 Claude 3 和 GPT-4 並列第一，GPT-4 的另一個預覽版也並列第一。

本文為品玩授權刊登，原文標題為「LMSYS Org 更新基準測試報告，Claude-3 超越 GPT-4」

Knowing

《Hit AI & Blockchain》國立臺灣大學資訊工程學系暨資訊網路與多媒體研究所副教授廖世偉：錢的本質是共識，流動性才是市場核心

讓 AI 長出手腳！國家智慧機器人研究中心今揭牌，5 大關鍵佈局一次看

【王智立專欄】投資新思維：問對問題

【林宏文專欄】太空第一股SpaceX值不值1.75兆美元？四角度看新股掛牌潛力，看馬斯克如何將信徒變成瘋狂追價的小股東

【林富元專欄】暫停的力量，讓你真正返璞歸真而得勝，如何開始？就從停止再說“我現在忙死了”開始！暫停的力量其一

【楊方儒專欄】中製APP侵台，AI新十大建設如何打造地圖國家隊？

【張瑞雄專欄】AI復活亡者電影業的倫理界限在哪裡？

【專訪】告別影子銀行時代！ADVANCE.AI 產品總監張毅深入解讀 Web3 監管矩陣與 AI 防線

驅動臺南製造新戰力！「2026 AI 應用製造業實戰交流會」南科登場，賦能傳統產業智慧升級