Meta AI宣布推出多語言閱讀理解數據集Belebele
品玩 / 何渝婷編譯
2023-09-04 09:55

(取自Meta AI官網)

Meta AI 近日宣布,推出一款名為 Belebele 的多語言閱讀理解數據集,可以直接比較模型對不同語言的理解程度。

Belebele 其中涵蓋了122種語言,可以評估高、中、低資源語言的單語言和多語言模型,該數據集由基於 FLORES-200 段落的精心設計的多項選擇題和答案組成,能夠以高資源和低資源語言評估 NLP 系統和大型語言模型。

由於 Belebele 是完全並行的,因此可以直接比較所有語言的模型性能。

Meta 表示,Belebele 為評估和分析語言模型和 NLP 系統的多語言能力開闢了新途徑。

本文為品玩授權刊登,原文標題為「Meta AI 宣佈推出多語言閱讀理解數據集 Belebele