Meta發表混合模態基座模型Chameleon，挑戰GPT-4o

Meta發表混合模態基座模型Chameleon，挑戰GPT-4o

品玩 / 何渝婷編譯

2024-05-20 15:00

（示意圖/取自pixabay）

根據 Arxiv 頁面顯示，Meta 近日發表論文，介紹旗下自研的混合模態基座模型Chameleon。

Meta表示，Chameleon有助於生成交錯的文本和圖像序列並進行推理，從而實現全面的多模式文檔建模。

與傳統模型不同，Chameleon採用了統一的架構，通過對圖像進行類似文本的標記化處理，對兩種模式一視同仁。

這種方法被稱為早期融合，可以實現跨模態的無縫推理，但也帶來了優化方面的挑戰。

為了解決這些問題，研究人員提出了架構改進和訓練技術，通過調整轉換器架構和微調策略。

本文為品玩授權刊登，原文標題為「Meta 發佈混合模態基座模型Chameleon，挑戰 GPT-4o」

Knowing

生成式AI帶動企業數位躍進林平康：企業需整合商業發展生態系

【新國會online】林岱樺將關注中小企業轉型、農業升級和雙語教育，更擘劃高雄新藍圖盼發展更上一層樓

加速各種全自動機器的開發！NVIDIA宣布推出Omniverse Cloud Sensor RTX

金管會攜集保及6家金融機構成立「RWA代幣化小組」！四大重點一次看

虛擬通貨公會正式成立，24家業者入會，制定《自律規範》為首要任務

金管會財委會報告搶先看！一分鐘看懂「虛擬資產專法」制定進程及未來規劃

立委葛如鈞籲金管會：須平衡防弊與發展！我們究竟為何需要虛擬通貨公會？

專屬的AI資料彙整助理！Google正式在台推出NotebookLM