蘇州大學推出開源大模型 OpenBA，具備150億參數

蘇州大學推出開源大模型 OpenBA，具備150億參數

品玩 / 何渝婷編譯

2023-09-23 10:00

（取自Arxiv 頁面）

根據 Arxiv 頁面顯示，來自中國蘇州大學的一個研發團隊近日推出一款名為 OpenBA 的開源 seq2seq 模型。

據悉， OpenBA 是一款具有150億參數的雙語非對稱seq2seq模型，也是首個加入中國開源模型社區的大語言模型變體。

論文顯示，研究者採用高效的技術以及採用三階段的訓練策略，從頭開始訓練了OpenBA模型。

實驗顯示，OpenBA 在 BELEBELE 基準測試中的性能優於 LLaMA-70B，在 MMLU 基準測試中的性能優於 BLOOM-176B，在 C-Eval（hard）基準測試中的性能優於 GLM-130B。

本文為品玩授權刊登，原文標題為「蘇州大學推出開源大模型 OpenBA，具備150億參數」

Knowing

【專訪】Chainvestigate執行長陳采履：幣流分析不只是打詐工具，更是Web3時代信任的基礎！

AI與Web3時代的軟硬融合契機，台灣不能再錯過！第十屆《WHATs NEXT》台灣網路產業高峰會今日成功舉辦

《WHATs NEXT》美國馬里蘭大學終身講座教授暨工業人工智慧中心主任李傑：善用數據分析，讓人來領導AI，而非AI來領導人！

《WHATs NEXT》台灣大哥大Web3事業副總經理暨富昇數位總經理韓昆舉：導入區塊鏈能同時完成資訊流與金流，使支付流程更透明、安全且高效

《WHATs NEXT》美國安卓樂資本(Andra Capital)董事長林家振：企業端的採用狀況，是衡量AI成效的最客觀指標

《WHATs NEXT》環球睿視執行長蘇育民：未來AI的競爭不只是軟體或硬體單一發展，而是「AI軟加硬」的整合模式

【林宏文專欄】輝達宣布投資OpenAI千億美元「AI超級良性循環」形成投資人要警覺了嗎？

《WHATs NEXT》財團法人商業發展研究院董事長許添財：台灣網路與數位科技發展，應有總體經濟的思維與國際戰略觀！

《WHATs NEXT》立法委員許智傑：高雄正在積極進行智慧轉型，期待能夠成為AI應用最強的城市