為什么說“不XLIFF,無翻譯”
隨著谷歌神經(jīng)網(wǎng)絡(luò)技術(shù)的公開和人工智能算法人才的涌現(xiàn),機器翻譯系統(tǒng)的開發(fā)不再神秘高深,很多企業(yè)針對自己的應(yīng)用場景,紛紛開發(fā)自己的機器翻譯系統(tǒng),訓(xùn)練自己細(xì)分領(lǐng)域的平行語料,從而針對自己的應(yīng)用場景提供更好的語言支持,例如在醫(yī)療領(lǐng)域就有很好的案例。
企業(yè)或個人需要翻譯的文件往往是非結(jié)構(gòu)化的 OFFICE 文檔和 INDESIGN 文件、結(jié)構(gòu)化的 XML 文件以及格式化的 PDF 或 HTML 文件,機器翻譯系統(tǒng)首要面對就是處理文件格式問題、段落斷句問題和標(biāo)簽字符對機器翻譯干擾問題,這往往是一般公司很難應(yīng)對的,而且直接影響了翻譯結(jié)果。
目前各種機器翻譯系統(tǒng)和智能翻譯系統(tǒng)百花齊放,各有千秋,企業(yè)或個人應(yīng)該享有開放生態(tài)環(huán)境的便利:使用任何系統(tǒng)都可以直接處理自己的文檔
XLIFF 格式就是這些問題和訴求的迎刃之解。XLIFF 是國際標(biāo)準(zhǔn)翻譯文件格式,理論上任何格式文檔都可以轉(zhuǎn)換成XLIFF格式文件,我們呼吁機器翻譯系統(tǒng)和智能翻譯系統(tǒng)開發(fā)商形成共識,默認(rèn)支持 xliff 格式文件,用戶只要提交 xliff 格式文件就可以進行機器翻譯。這樣機器翻譯系統(tǒng)和智能翻譯系統(tǒng)開發(fā)商只要專注于機器翻譯的算法就成,好鋼用在刀刃上。
同時用戶通過采用 xliff 格式進行翻譯,而不是原始文檔,不僅輕松解決了干擾翻譯的格式問題,而且有助于保護自己的知識產(chǎn)權(quán)不被非法利用。