- 簽證留學(xué) |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語 |
- 德語
盡管有限狀態(tài)轉(zhuǎn)錄機和有限狀態(tài)自動機在數(shù)學(xué)上十分相似,但這兩個模型卻是在不同傳統(tǒng)的基礎(chǔ)上發(fā)展起來的。有限自動機是在Turing(1936)的算法計算模型和McCulloch及Pitt的與有限狀態(tài)模型極為相近的神經(jīng)元模型的基礎(chǔ)上發(fā)展起來的。但是,Turing機器對于轉(zhuǎn)錄機的影響卻不那么直接。Huffman(1954) 在Shannon(1938)關(guān)于轉(zhuǎn)接電路的代數(shù)模型的基礎(chǔ)上,提出了狀態(tài)轉(zhuǎn)移表來模擬時序電路的行為。在Turing和Shannon以及鮮為人知的Huffman的工作基礎(chǔ)上,Moore(1956)為了描述使用輸入符號字母表和輸出符號字母表并且具備有限個數(shù)目的狀態(tài)的機器,引入了有限自動機(finite automaton)這個術(shù)語。Mealy(1955)進一步推廣并綜合了Moore和Huffman 的研究成果。
Moore在原來的文章里所描述的自動機與Mealy后來推廣的自動機有著重要的區(qū)別。在Mealy自動機中,輸入/輸入符號是通過狀態(tài)之間的轉(zhuǎn)移來聯(lián)系的。而一些有限狀態(tài)轉(zhuǎn)錄機就是Mealy自動機。在Moore自動機中,輸入/輸出符號是通過狀態(tài)來聯(lián)系的。這兩種類型的轉(zhuǎn)錄機是等價的,Moore自動機可以轉(zhuǎn)換成等價的Mealy自動機,反之亦然。
很多早期的形態(tài)剖析程序使用詞綴剝離法(affix-stripping)來進行剖析。例如,在Packard(1973)的古希臘語剖析器中,就反復(fù)地剝離輸入單詞中的前綴和后綴,使剩余的詞根突顯出來,然后再在詞表中查找剩余的詞根,并返回與被剝離的詞綴相容的詞根。這個方法等價于自底向上(bottom-up)剖析法。
AMPLE(A Morphological Parser for Linguistic Exploration,用于語言研究的形態(tài)剖析器)(Weber and Mann,1981;Weber et al.,1988 ; Hankamer and Black, 1991)是另一個早期的自底向上的形態(tài)分析器。AMPLE包含一個詞表,在詞表中存儲每個語素的所有可能的表層變體(稱為語素變體,allomorphs),以及它們出現(xiàn)時的限制(例如,英語中的-es這個表示復(fù)數(shù)的語素變體只能出現(xiàn)在s, x, z, sh或ch之后)。該系統(tǒng)要找出與輸入相匹配的每個可能的語素序列,然后進行過濾,把那些不滿足限制條件的序列去掉。