Meta發布全新AI翻譯大模型,即時語音轉換不超過2秒
東尋 / 何渝婷編譯
2023-12-22 11:10

(取自Meta臉書粉專)

根據《站長之家》 12 月 22 日報導,Meta 最新發表了一系列 AI 翻譯大模型,實現即時語音轉換延遲不超過 2 秒,支援多種語言翻譯,並具備模仿語氣、語速、情感等特徵的能力。

這一系列模型名為 Seamless Communication,包括 SeamlessExpressive、SeamlessStreaming、SeamlessM4 T v2 和 Seamless,其中前三個已經在 GitHub 上開源。

為確保翻譯準確性和避免濫用,Meta 採用了毒性緩解技術,在訓練前過濾「有毒內容」並在翻譯生成過程中自動檢測和調整生成的有毒單詞,同時為音訊添加了浮水印以追蹤來源。

為了防止濫用風險,Meta 還為音訊添加了浮水印,通過在音訊中嵌入不可察覺的訊號,可以準確追蹤音訊的來源,並對抗各種攻擊手段。

本文為AI新智界授權刊登,原文標題為「Meta 發佈全新 AI 翻譯大模型,實時語音轉換不超 2 秒