18 個開源的項目本地化翻譯工具
本地化在定製開源項目以適應世界各地用戶的需求方面發揮著核心作用。 除了代碼之外,語言翻譯也是世界各地人們貢獻和參與開源項目的主要方式之一。
有專門針對語言服務行業特有的工具(聽到這件事是不是很驚訝?),這使得高品質的本地化過程可以很順暢。 本地化工具的類別包括:
- 計算機輔助翻譯工具(CAT)
- 機器翻譯引擎(MT)
- 翻譯管理系統(TMS)
- 術語管理工具
- 本地化自動化工具
這些工具的專有版本可能相當昂貴。一個 SDL Trados Studio (領先的 CAT 工具)的許可證可能要花費數千歐元,即使這樣,它只能一個人使用,並且定製功能也是有限的(注意,它們的費用也很高)。開源項目希望本地化到多種語言,簡化本地化過程,所以希望找到開源工具來節省資金,並可以通過定製獲得所需的靈活性。我對許多開源本地化工具項目進行了深入的調查,以幫助您決定使用什麼。
計算機輔助翻譯工具(CAT)
![OmegaT CAT 工具](/data/attachment/album/201709/25/234927qd0cmj2bddd4peqq.png "OmegaT CAT tool")
OmegaT CAT 工具。在這裡您可以發現翻譯記憶(模糊匹配)和術語回顧(術語表)特性。OmegaT 在 GPL v3 許可證之下發布。
CAT 工具是語言服務行業的主要工具。 顧名思義,CAT 工具可以幫助翻譯人員儘快完成翻譯、雙語審查和單語審查的任務,並通過重用翻譯內容(也稱為翻譯記憶),達到儘可能高的一致性。 翻譯記憶 和 術語回憶 是 CAT 工具的兩個主要特性。它們能夠使譯者在新項目中重用以前項目中翻譯的內容。這使得他們可以在較短的時間內翻譯大量的文字,同時通過術語和風格的一致性保持較高水平的質量。這對於本地化特別方便,因為許多軟體和 web UI 中的文本在平台和應用程序中通常是相同的。 儘管 CAT 工具是獨立的軟體,但需要翻譯人員在本地使用它們併合併到中央存儲庫。
可用工具:
機器翻譯引擎(MT)
機器翻譯引擎自動將文本從一種語言翻譯到另一種語言。機器翻譯引擎被分成三種主要的方法:基於規則、統計式和神經網路式(這是新技術)。最廣泛的機器翻譯引擎方法是統計式,簡而言之,通過使用 n-gram 模型 對帶注釋的雙語語料庫數據進行統計分析,得出關於兩種語言之間的相互關聯性。當將新的源語言短語引入到引擎進行翻譯時,它會在其分析的語料庫數據中查找與目標語言產生統計相關的對等物。機器翻譯引擎可以作為翻譯人員的生產力輔助工具,將他們的主要任務從將源文本轉換為目標文本,改變為對機器翻譯引擎的目標語言輸出結果的後期編輯。我不建議在本地化工作中使用原始的機器翻譯引擎輸出結果,但是如果您的社區接受了後期編輯的培訓,那麼機器翻譯引擎可以成為一個有用的工具,幫助他們做出大量的貢獻。
可用工具:
翻譯管理系統(TMS)
![Mozilla 的 Pontoon 翻譯管理系統用戶界面](/data/attachment/album/201709/25/234944q2t7vxmpec406410.png "Mozilla's Pontoon translation management system user interface")
如上是 Mozilla 的 Pontoon 翻譯管理系統用戶界面。使用所見即所得編輯方式,您可以在上下文根據語境翻譯內容,在翻譯的同時保證質量。 Pontoon 在 BSD 3 句版許可證(新款或修訂版)之下發布。
翻譯管理系統工具是基於 web 的平台,允許您管理本地化項目,並使翻譯人員和審閱人員能夠做他們最擅長的事情。 大多數翻譯管理系統工具旨在通過包括版本控制系統(VCS)集成、雲服務集成、項目報告以及標準的翻譯記憶和術語回憶功能,實現本地化過程中的許多手工部分的自動化。這些工具最適合於社區本地化或翻譯項目,因為它們允許大量的翻譯人員和審閱人員為一個項目做出貢獻。一些人還使用所見即所得編輯器為他們的翻譯者提供翻譯語境。這種增加的語境可以提高翻譯的準確性,減少譯者在用戶界面里翻譯和審查翻譯之間需要等待的時間。
可用工具:
術語管理工具
![楊百翰大學的 BaseTerm 工具](/data/attachment/album/201709/25/234948a554uwiv55ohuuek.png "Brigham Young University's BaseTerm tool")
楊百翰大學 (Brigham Young University) 的 BaseTerm 工具顯示了新術語條目的對話窗口。 BaseTerm 在 Eclipse 公共許可證之下發布。
術語管理工具為您提供 GUI 來創建術語資源(稱為術語庫)以添加語境並確保翻譯的一致性。這些資源在幫助翻譯人員的翻譯過程中用於 CAT 工具和 TMS 平台。 對於一個術語基於語境可以是名詞或動詞的語言,術語管理工具允許您添加標記其詞性、方言、單語定義以及上下文線索的術語元數據。 術語管理通常是本地化過程中使用不多的部分,但也是同樣重要的部分。 在開源軟體和專有軟體的生態系統中,只有少量的可選產品。
查看工具
自動本地化工具
![Okapi 框架的 Ratel 和 Rainbow 組件](/data/attachment/album/201709/25/234950m9orpp8qv91j7znx.jpg "Ratel and Rainbow components of the Okapi Framework")
Okapi 框架的 Ratel 和 Rainbow 組件。 圖片由 Okapi 框架提供。Okapi 框架在 Apache 許可證 2.0 之下發布。
自動本地化工具便於您處理本地化數據。這可以包括文本提取、文件格式轉換、標記化、VCS 同步、術語提取、預翻譯和對通用的本地化標準文件格式的各種質量檢查。在一些工具套件中,如 Okapi 框架,您可以創建用於執行各種本地化任務的自動化流程。這對於各種情況都非常有用,但是它們的主要功能是通過自動化許多任務來節省時間。它們還可以讓你更接近一個根據連續的本地化流程。
查看工具
為什麼開源是關鍵
本地化在開源時是最強力有效的。 這些工具應該讓您和您的社區能夠將您的項目本地化為儘可能多的語言。
想了解更多嗎? 看看這些附加資源:
- 自由/開源的機器翻譯軟體 列表
- 開放翻譯工具 電子書
(題圖: opensource.com)
作者簡介:
Jeff Beatty - Jeff Beatty 是 Mozilla 公司本地化的負責人, Mozilla 是流行的開源 web 瀏覽器 Firefox 的製造商。 他擁有利默里克大學(University of Limerick)多語言計算和本地化專業碩士學位。 Jeff 還在全球知名刊物中擔任本地化專家,如 《經濟學人》 、 《世界報》 、多語種雜誌等。 Jeff 旨在展示 Mozilla 的本地化程序,創建顛覆性的開源翻譯技術,並充當傳播橋樑。
via: https://opensource.com/article/17/6/open-source-localization-tools
作者:Jeff Beatty 譯者:TimeBear 校對:wxy
本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive