- 簽證留學(xué) |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語 |
- 德語
三、字數(shù)統(tǒng)計
字數(shù)統(tǒng)計是翻譯過程中最具爭議的問題之一,因為這直接關(guān)系到費用支付,現(xiàn)今在本地化行業(yè)中絕大多數(shù)翻譯工作都是按字數(shù)支付報酬的,因此我們著重來看一下不同的TM工具是如何計算字數(shù)的。首先來看看Word。Word將任何字符或以空格分隔的任何單詞及符號都算做單獨的字。某些符號即使無需翻譯,也被當(dāng)做單獨的字,如($,
%,&,/)在Word中是被當(dāng)做4個字來計算的。此外,數(shù)字也被當(dāng)做單獨的字來計算。
SDLX則提供了兩種計數(shù)方式,一種是完全等同于Word的方式,一種則是SDLX特有的方式,該方式將數(shù)字及一些特殊字符也作為字數(shù)計算,但它不將符號當(dāng)做字數(shù),比如項目符號或編號等,這些在Word中是被當(dāng)做單獨字數(shù)計算的。Translator's Workbench 只計算可翻譯的文本,不包括任何數(shù)字及符號。下表列出了不同TM工具處理字數(shù)統(tǒng)計的對照表,以供參考。
四、文件格式
每個TM工具都會提供其所支持的文件格式的一覽表以供用戶參考。在一般情況下,最終用戶都不必過于擔(dān)心,因為大多數(shù)TM工具都能夠處理大多數(shù)常見的文件格式。然而,如我們所知,本地化項目往往要處理許多不可預(yù)見的文件格式,同時不同格式的文件中的復(fù)雜度也是不可預(yù)見的。碰到這類情形時,就要看哪個工具提供商能夠提供更靈活的接口,允許用戶自行創(chuàng)建或者自定義過濾器及轉(zhuǎn)換程序。
有些工具使用Word作為默認編輯器,比如Translator's Workbench和Wordfast,因此,只要被翻譯的文檔可以用Word打開,就無需進行任何轉(zhuǎn)換或使用任何過濾器;如果Word無法很好地打開,或者該文檔需要做進一步處理,則這些工具通常要么另行提供一種編輯器(比如Trados就另行提供 TagEditor來處理所有的標(biāo)記語言如 html、xml等),要么對該文檔進行轉(zhuǎn)換之后再用Word打開(比如Trados提供的過濾器之一S-Tagger for FrameMaker就是專為將FrameMaker 文件轉(zhuǎn)換為Word可以打開的RTF文件的),相應(yīng)地,文檔翻譯完后還需要重新轉(zhuǎn)換回去。
五、模糊匹配與匹配率
模糊匹配是所有TM工具都應(yīng)用的一項技術(shù),當(dāng)所要翻譯的文本片段與TM中的某個片段比較近似時,TM工具在預(yù)處理時會將其標(biāo)識為模糊匹配(Fuzzy Match),同時TM工具還會通過某種算法來比較兩個片段的相似程度,并給出一個百分比。比例越高,表明TM中該近似片段被利用的程度也就越高;比例為100%時,即稱之為100%匹配,表明該譯文是可以完全利用的。
由于各個TM工具所采用的算法各不相同,因此,即使是使用同一個TMX和同一段文本,其所得出的模糊匹配也往往是不盡相同的,下圖簡要地比較了各個工具對同一文本片段的分析結(jié)果,以供參考。
責(zé)任編輯:admin