Linux中國

Meta 開源了語言翻譯 AI 模型

Meta(前身是 Facebook)在開源世界做出了不小的貢獻。Meta 除了專註於 元宇宙 Metaverse 和其社交媒體平台外,還致力於各種研究和創新工作,比如 React(一個 JaveScript 庫)。

現在,Meta 的研究人員決定開源一個叫 「 不落下任何語言 No Language Left Behind 」 項目。

(LCTT 校註:這個直譯項目名稱不夠好聽,我來拋磚引玉,似可稱做「無人獨語」,讀者有什麼建議嗎?)

Meta 試圖不落下任何語言

目前,雖然世界上有大約 7000 個在使用中的語言,但大多數在線的內容都是以少數的流行語言來提供的,比如英語。這讓許多不懂這些語言的人處於不利的地位。

雖然現存的許多翻譯工具,但語法錯誤會讓錯誤變得難以閱讀和理解。另外,如果你想把內容翻譯為一個不流行的語言(特別是非洲和亞洲的一些語言),翻譯體驗不會很好。

因此,Meta 正在開發有最高質量的翻譯工具,可以幫助解決這一全球性的問題。

NLLB-200( 不落下任何語言 No Language Left Behind ) 是一個人工智慧翻譯模型,其可以翻譯 200 多種語言。該模型在每種語言中的翻譯結果是通過一個名為 FLORES-200 複雜數據集來確定和評估的。

正如 Meta 所說,NLLB 的翻譯結果比以前的人工智慧研究方法好 40% 。對於一些最不常見的語言,其翻譯準確率甚至超過 70%。了不起的工作!

為了幫助開發項目和提高模型的翻譯質量,Meta 向所有感興趣的研究人員開放了源代碼,包括 NLLB-200 模型、FLORES-200 資料庫、模型訓練和重建訓練資料庫的代碼。

你可以在 GitHub 上找到源代碼,並且可以在該項目的 博客 上了解它的更多信息。

對社會事業的鼓勵

Meta 宣布向從事 聯合國可持續發展目標 UN Sustainable Development Goals 任何領域工作和翻譯非洲語言的非營利組織和研究人員提供高達 20 萬美元的捐贈,也鼓勵其他學術領域如語言學和機器翻譯的研究人員申請。

項目的影響

儘管 Meta 主要打算在其數字平台上,特別是在「元宇宙」上使用 NLLB,但 NLLB 也有可能在其他領域產生巨大影響。

許多用戶可以用他們的母語輕鬆地訪問和閱讀在線資源。項目開源後,社區應該能夠幫助實現這個目標。

你對 Meta 的這個項目有什麼看法?

via: https://news.itsfoss.com/meta-open-source-ai-model/

作者:Rishabh Moharir 選題:lkxed 譯者:fenglyulin 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的電子郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國