Meta有望將在下週發表兩個小型的Llama 3大模型
品玩 / 何渝婷編譯
2024-04-09 10:26

(示意圖/取自pixabay)

根據《 The Information 》報導,Meta 計劃在下週推出兩款小型的 Llama 3 模型,為即將在今年夏季發表的正式版 Llama 3 模型預熱。

Meta 相信,這兩款小模型的發表有助於激發人們對於Llama 3 模型的興趣,Meta希望Llama 3能趕上OpenAI的GPT-4,後者能根據用戶上傳到聊天機器人上的圖片回答問題。

正式版的Llama 3 將支援多模態,它將能夠理解並生成文本和圖像;相比之下,下週發表的兩款小型機將不具備多模態功能。

與大型模型相比,小型模型通常成本更低,運行速度更快,在運行大型模型成本高昂的情況下,小型模型的價值日益凸顯。

對於想在行動設備上開發人工智慧軟體的開發者來說,小型模型也很有價值。

Meta 此前發表了三種 Llama 2 模型,其中最大的模型有 700 億個參數,這些參數設置編碼了模型在訓練過程中的學習內容,另外兩個模型分別有 130 億個參數和 70 億個參數。

而最近幾個月,Meta 公司的領導認為 Llama 2 在回答有爭議的問題時過於保守,因此該公司生成 AI 部門的員工一直在努力讓 Llama 3 更開放地回答有爭議的問題。

據報導,Meta 有望將會在今年7月之後發表正式版的Llama 3大模型,該版本的 Llama 3 可能擁有超過 1400 億個參數。

本文為品玩授權刊登,原文標題為「Meta 或將在下周發佈兩個小型的 Llama 3 大模型