微軟發布27億參數語言模型 Phi-2，性能可媲美或優於比它大25倍的模型

微軟發布27億參數語言模型 Phi-2，性能可媲美或優於比它大25倍的模型

Yangz / 何渝婷編譯

2023-12-13 10:31

（示意圖/取自pixabay）

微軟發佈 27 億參數的語言模型—Phi-2，據介紹，由於在模型縮放和訓練數據整理方面進行了創新，在複雜的基準測試中，Phi-2 的性能可媲美或優於比它大 25 倍的模型。

據悉，Phi-2 是一個基於 Transformer 的模型，在 1.4 T 的詞塊上進行了訓練，這些詞塊來自 NLP 和編碼的合成數據集和網路數據集。

在 96 個 A100 GPU 上對 Phi-2 的訓練耗時 14 天，Phi-2 是一個基礎模型，沒有通過人類回饋強化學習（RLHF）進行調整，也沒有經過指導性微調。

儘管如此，與經過對齊的現有開源模型相比，Phi-2 在毒性和偏差方面有更好的表現。

在各種綜合基準測試中，Phi-2 超越了 Mistral 和 Llama-2 模型在 70 億和 130 億參數下的性能。

值得注意的是，在多步驟推理任務（即編碼和數學）上，Phi-2 的性能是 Llama-2-70 B 模型的 25 倍。

此外，Phi-2 的性能與最近發佈的 Google Gemini Nano 2 不相上下，甚至更勝一籌。

本文為AI新智界授權刊登，原文標題為「微軟發佈 27 億參數語言模型 Phi-2，性能可媲美或優於比它大 25 倍的模型」

Knowing

【立院小食堂3】看好無人載具打前鋒！鍾佳濱拋專法打破多頭馬車，力拚打造下個護國神山

從農業穀倉到科技新引擎：NEAT台灣新經濟連盟攜手跨域產業拜會嘉義縣政府，AI與機器人應用合作啟動

【立院小食堂3】葛如鈞公開點名感謝蔣萬安！原因曝光：為科技宅立了大功

理賠一甲子還在用「紙和尺」？創星物聯林俊彥：訓練 AI 模型當大腦，比行天宮算命還準！

【立院小食堂3】狂騎鐵馬510公里！陳亭妃拚台南400年首位女市長：37區支持者就是我的眼睛耳朵

【林宏文專欄】輝達、高通登場 AI讓大家都要撈過界聯發科與高通的競爭有看頭

拼中小微新創轉型升級條例9月送立院！卓榮泰出席InnoVEX 2026四大重點一次看

【楊方儒專欄】台灣碰到Web2就轉彎！十年來面對Uber與Grab侵台，各部會仍在瞎子摸象？

【王智立專欄】「弱連結」在不同的專業領域的定義與應用

立院財委會今初審通過「虛擬資產服務法」！四大攻防重點與最新監理亮點全解析