蘋果發表OpenELM，基於開源訓練和推理框架的高效語言模型

蘋果發表OpenELM，基於開源訓練和推理框架的高效語言模型

品玩 / 何渝婷編譯

2024-04-25 10:30

（示意圖/取自pixabay）

根據《Readhub》報導，在 WWDC24 之前，蘋果在 Hugging Face 平台上發表了一個「具有開源訓練和推理框架的高效語言模型」，名為 OpenELM。

這是一項開源語言模型，其源碼及預訓練的模型權重和訓練配方可在蘋果 Github 庫中獲取。

OpenELM 使用分層縮放策略，可以有效地分配 Transformer 模型每一層的參數，從而提高準確率。

例如，在參數量約為 10 億的情況下，OpenELM 與 OLMo 相比準確率提升了 2.36%，同時所需的預訓練 tokens 數量僅有原來的 50%。

本文為品玩授權刊登，原文標題為「蘋果發佈 OpenELM，基於開源訓練和推理框架的高效語言模型」

Knowing

【新國會online】遭陳建仁嗆「外行」！新科立委廖偉翔謹記胡志強教誨爬起再戰

【新國會online】立法院壯世代政策及產業發展促進會即將成立！吳春城召集63位跨黨派立委欲推動《壯世代基本法》

蘋果將於5月7日舉行Let Loose發表會！新一代iPad Pro/Air 四大預測一次看

美國總統候選人小羅伯特甘迺迪希望將美國全部預算放在區塊鏈上，藉此提高透明度與問責制

【林宏文專欄】日本如何看待台灣半導體業？從四個問題看日台聯盟與半導體商機

【新國會online】盧秀燕耳提又面命！立委楊瓊瓔要用金頂電池的活力繼續跟民眾站在一起！

財經新內閣名單出爐！立委林思銘：台灣不能只靠半導體這個護國神山

財經新內閣名單出爐！立委吳春城呼籲：別忘了手握台灣三分之二以上財富的壯世代，已是另一座護國神山