Hugging Face推出最小視覺語言模型，可在低算力設備上運行

Hugging Face推出最小視覺語言模型，可在低算力設備上運行

品玩 / 何渝婷編譯

2025-01-24 15:00

根據 Hugging Face 頁面顯示，旗下最小多模態大模型SmolVLM-256M 近日發表，它可以接收任意序列的圖像和文本輸入，從而產生文本輸出。

據悉，SmolVLM-256M的設計旨在提高效率，SmolVLM 可以回答有關圖像的問題、描述視覺內容或轉錄文本，它的輕量級架構使其適用於設備上的應用，同時在多模態任務中保持強勁的性能。

只需不到 1GB 的 GPU 內存，它就能在一幅圖像上進行推理。

需要注意的是，該模型不支持圖像生成。

本文為品玩授權刊登，原文標題為「Hugging Face推出最小視覺語言模型，可在低算力設備上運行」

Knowing

【專訪金管會副主委莊琇媛】讓資金不再流浪！從財管3.0到亞資中心，撥動兆元天平的財富歸巢計畫

【林富元專欄】投資家看黑白大廚，好像創業家企業家繽紛絢爛的競賽

AI 成為新一輪成長引擎！國發會揭示 2026 年經濟藍圖：鎖定 2 大成長目標、3 大政策主軸

【林宏文專欄】美中競賽已成合作與共榮局面？市場很大，各取所需兩強較勁下台灣勝出之道

把流量導進商圈！產官學跨界交流《AI型商·智慧商圈座談會》助攻高雄商圈數位轉型

台新銀行攜手虛擬資產交易所HOYA BIT禾亞數位科技合作新臺幣信託服務全天候出入金兼顧安全與便利性

驅動數位轉型新篇章！台電「共創數據永續新動能」論壇圓滿落幕

遠銀Bankee攜手警政署與VASP啟動跨域防詐網！三方聯防成功返還詐騙金額佔全臺1/4