把腿张开老子臊烂你多p视频软件,free性国产高清videos,av在线亚洲男人的天堂,hdsexvideos中国少妇,俄罗斯真人性做爰

會員中心 |  會員注冊  |  兼職信息發(fā)布    瀏覽手機版!    超值滿減    人工翻譯    英語IT服務 貧困兒童資助 | 留言板 | 設為首頁 | 加入收藏  繁體中文
當前位置:首頁 > 機翻技術 > 機器翻譯 > 正文

機器翻譯技術方法的簡單介紹

發(fā)布時間: 2016-03-15 18:14:10   作者:etogether.net   來源: 網(wǎng)絡   瀏覽次數(shù):
摘要: 機器翻譯方法主要有基于規(guī)則的機器翻譯,基于語料庫的機器翻譯和混合式機器翻譯方法。
 
機器翻譯
 
 
人們一直在尋求更好的解決問題的方法,目前機器翻譯方法主要有基于規(guī)則的機器翻譯,基于語料庫的機器翻譯和混合式機器翻譯方法。
1基于規(guī)則的機器翻譯方法
1.1基于分析和轉換的機器翻譯方法
人作翻譯時,把一個源語言句子譯成目標語言句子,設計到四個基本操作:目標語言單詞的檢索、調序、刪詞、增詞;機器翻譯系統(tǒng)的過程包括檢索、分析、轉換和生成主要四個階段,這被稱為基于分析和轉換的機器翻譯系統(tǒng),也被認為是模擬人類翻譯活動最恰當?shù)臋C制。
該方法有三個階段,為分析—轉換—生成。一般情況下,分析以句法為主、語義為輔,正確的句法結構轉換加正確的詞匯譯文可以從源語言向目標語言傳遞完整的正確信息。以句法結構轉換附加一定的語義信息, 能夠構成轉換的基本層次[3]。標準機器翻譯系統(tǒng)中句子和短語層次的結構轉換是核心,產(chǎn)生式方式的轉換規(guī)則形式為:
S:S1+S2+???Si
S是源語言的某個待翻譯單位(句子、短語等等),S1~Si是S中的下一級組成單位對于S,如果滿足條件
上述方法稱為基于句法的轉換方法, 因為S1+S2+???Si一般來說就是源語言的的句法結構表示:也可以稱為直接轉換方法, 因為對于每個源語言的翻譯組塊, 都馬上給出一個目標語言組塊與之對應應該說, 這種轉換方法符合人的直覺認識, 也能夠實現(xiàn)。
 
1.2基于中間語言的機器翻譯方法
基于中間語言的翻譯方法是對源語言進行分析以后產(chǎn)生一種稱為中間語言的表示形式,然后直接由這種中間語言的表示形式生成目標語言。所謂中間語言就是自然語言的計算機表示形式的系統(tǒng)化, 它試圖創(chuàng)造出一種獨立于各種自然語言,同時又能表示各種自然語言的人工語言。
基于中間語言的機器翻譯方法的優(yōu)勢是無需一種語言到另一種
語言的一一轉換,對于多語種的翻譯系統(tǒng)可以節(jié)約大量的轉換知識的手工獲取工作量,假如有N種語對需要相互翻譯, 只要有2N個分析和生成模塊就夠了。其中一半是源語言分析模塊,輸入為原文,輸出以1L表示:另一半是目標語言生成模塊,輸入為1L表示,輸出為目標語言譯文。然而,中間語言的機器翻譯方法也常遭到懷疑。因為是否能夠構造出表示各種不同的自然語言語法、語義的中間語言至少目前還是未知數(shù)。此外,中間語言能不能把各種語言的所有特征保留下來,又能很好生成對應的各種語言也是問題。所以,構造中間語言是一個巨大、復雜的工程,還包含許多理論研究,迄今為止的探索還沒有好的答案[3]。
基于轉換的方法采取了一系列轉換生成層次,各種分析多(如詞法、句法、語義和語境等),而且在分析的過程中,會出現(xiàn)許多歧義結構,顯然,如果沒有好的算法,效率就會低;此外,對于那些不符合語法規(guī)則的句子,這種方法難于給出正確的翻譯結果。
 
2基于語料庫的機器翻譯方法
2.1基于統(tǒng)計的機器翻譯方法
基于統(tǒng)計的機器翻譯方法,一般不要任何語言學知識,它的基本原理是實現(xiàn)源語言詞匯到目標語言詞匯的映射。其思路受到語音識別研究的啟發(fā),因而應用了類似的方法來實現(xiàn)。研究者用大規(guī)模的雙語語料庫作為基礎,對源語言和目標語言詞匯的對應關系進行統(tǒng)計,根據(jù)統(tǒng)計規(guī)律輸出譯文。這種方法沒有使用語言知識,主要特征是概率噪聲信道統(tǒng)計與隨機過程的方法成為了分析和生成過程的唯一方法。它的主要內容是雙語句對的對齊,通過詞匯同現(xiàn)的可能性來計算一種語言的一個詞映射到另一種語言的一個詞(或兩個、零個詞)的概率。應該說,基于統(tǒng)計的機器翻譯方法的出現(xiàn)改變了機器翻譯研究的面貌, 從而開始了機器翻譯研究的新階段。
統(tǒng)計方法最先在語音識別領域取得了成功,機器翻譯的噪聲通道模型可以視作最早的機器翻譯思想, 其思路可以這樣理解:
目標語言句子源語言句子
假設說話者已經(jīng)用目標語想好了一句話T,但是說出的卻是源語言句子S。這樣一個過程可以看成為編碼過程。而統(tǒng)計的機器翻譯就是要從S回推T, 可以看成解碼過程。這樣,統(tǒng)計的機器翻譯任務分為兩個部分:一是建模,即建立翻譯的計算方法以及從雙語語料庫中估計模型的參數(shù);二是解碼,即尋求一種高效搜索算法取有關概率計算的最大值。
基于統(tǒng)計的方法以大規(guī)模的雙語語料庫為基礎,需要訓練,一般翻譯速度比較慢;而且它還有被懷疑之處——這種方法會不會由于本身的固有屬性,不可能有很高的譯文正確率。但基于統(tǒng)計的機器翻譯方法還是具有很多優(yōu)勢,如開發(fā)速度快、周期短、無需人工干預等,在特定領域訓練數(shù)據(jù)充分的情況下翻譯性能基本可以達到實用水平。
2.2基于實例的機器翻譯方法
基于實例的機器翻譯方法通過結構化的翻譯例子直接把源語言的短語和句子與目標語言的短語和句子對應起來,方法的不同使得處理步驟或多或少,但都必須實現(xiàn)源語言到目標語言的轉換,其映射關系或者是詞到詞,或者是短語或句子到與之相應的等價物,或者是一棵句法樹到另一棵句法樹[4]。
基于實例的機器翻譯(EBMT)的實現(xiàn)過程簡單概述如下:給定源語言輸入句子S,在雙語語料庫C中匹配查找一個最相近的句子S’,則S’的譯文就被接受為S的譯文。翻譯的過程一般就是查找和復現(xiàn)相似的例子,發(fā)現(xiàn)和記起特定的源語言表達或相似的表達在以前是如何翻譯的,把以前的翻譯實例作為主要知識源。
3混合式機器翻譯方法
基于混合式的機器翻譯方法能夠很好的利用兩種方法的優(yōu)點,目前非常盛行?;旌鲜綑C器翻譯方法是將基于規(guī)則的翻譯方法和基于統(tǒng)計的翻譯方法結合。在基于規(guī)則的技術中引入語料庫方法,其中有基于實例的方法、統(tǒng)計方法,通過對語料庫的預處理使其轉化為自然語言知識庫的方法。Rules post-processed by statistics統(tǒng)計方法做后處理,翻譯使用規(guī)則方法。Statistics guided by rules使用規(guī)則方法做前后處理,翻譯使用統(tǒng)計方法。
混合式機器翻譯方法是效果最好的,但目前混合方法中各種模型的耦合方式還比較松散,進行多翻譯模型的深度融合可能是未來研究的一個熱點。Google已經(jīng)利用深度學習技術提升了旗下多個產(chǎn)品的智能體驗,該技術藉由大量的數(shù)據(jù)來訓練神經(jīng)網(wǎng)絡,從而對新數(shù)據(jù)做出預測。Google翻譯也將開始引入這一深度學習技術,以提高用戶的翻譯體驗。
微信公眾號

  • 上一篇:主流CAT 內置的機器翻譯支持比較
  • 下一篇:沒有了


  • 《譯聚網(wǎng)》倡導尊重與保護知識產(chǎn)權。如發(fā)現(xiàn)本站文章存在版權問題,煩請30天內提供版權疑問、身份證明、版權證明、聯(lián)系方式等發(fā)郵件至info@qiqee.net,我們將及時溝通與處理。


我來說兩句
評論列表
已有 0 條評論(查看更多評論)