微軟推出Florence-2視覺基礎模型
品玩 / 洪嘉鎂編譯
2024-06-27 15:00

根據微軟官方消息,微軟推出視覺基礎模型 Florence-2,該模型現已能夠在支援 WebGPU 的瀏覽器中 100% 主機運行。

Florence-2-base-ft 是一個擁有 2.3 億參數的視覺基礎模型,採用基於提示的方法來處理廣泛的視覺和視覺語言任務。該模型支援多種功能,可用於生成影像、識別字符、分割影像、偵測物體等等。

Florence-2 的主機化運行得益於 Transformers.js 和 ONNX Runtime Web 技術的支援。這一突破不僅提高了使用者隱私保護水準,還大大降低了使用成本,為 AI 視覺技術的普及應用鋪平了道路。

本文為品玩授權刊登,原文標題為「微軟推出最新視覺基礎模型Florence-2 可在瀏覽器中本地運行