- 簽證留學(xué) |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語 |
- 德語
圖3 覆蓋形容詞短語內(nèi)部組成成分細節(jié)的FSA語法的FSA語法的一部分
圖2和圖3中的自動機可以組合成一個單一的更大的名詞組識別器。這個識別器以NG自動機開始,迭代地把每個參照展開為其他規(guī)則或自動機。因為這些參照中沒有一個是遞歸的,即AdjP的展開不必參照AdjP,所以這樣的展開是可能的。
但是,如果建立一個更復(fù)雜的英語語法,就會出現(xiàn)這種遞歸。例如,在關(guān)系從句和其他名詞后修飾語的規(guī)則中,定義一個完整的NP需要參照其他NP。
處理遞歸的一個方法是限制遞歸的數(shù)量,只允許有限數(shù)量的遞歸。FASTUS就是這樣做的。在FASTUS中使用了層疊式自動機,一層一層地從較小的名詞組逐漸構(gòu)成較大的名詞組,這樣就限制了遞歸在每個層次中的數(shù)量。FASTUS的第二層發(fā)現(xiàn)非遞歸的名詞組;第三層把這些名詞組加上度量短語,結(jié)合成更大的像NP那樣的單位:
20, 000 iron and "metal wood" clubs a month
然后再附加上介詞短語:
production of 20, 000 iron and "metal wood" clubs a month
再處理名詞組連接詞:
a local concern and a Japanese trading house
在一個單層的系統(tǒng)中,這些現(xiàn)象的每個都分別要求遞歸規(guī)則(例如,NP→NP and NP)。但是,如果把剖析分解成兩個層次,F(xiàn)ASTUS就可以把規(guī)則左手邊的一個NP作為不同種類的對象來處理,也就是說,把規(guī)則左手邊的一個NP作為規(guī)則右手邊的兩個NP來處理。
處理遞歸的第二種方法是使用貌似有限狀態(tài)而實際上并非有限狀態(tài)的模型。其中的一個模型是遞歸轉(zhuǎn)移網(wǎng)絡(luò)(Recursive Transition Network,簡稱RTN)。一個RTN可以使用如圖2和圖3所示的狀態(tài)圖的集合來定義,其中每個弧上有一個終極符號或非終極符號。RTN和FSA的不同之處在于它們處理非終極符號的方法。在RTN中,每當自動機遇到一個帶有非終極符號的弧時,它把這個非終極符號作為一個子程序(subroutine)來處理。自動機把它的當前位置放到一個棧中,跳到這個非終極符號。當這個非終極符號剖析結(jié)束之后,自動機再跳回原位置。如果一個NP規(guī)則包含一個自身的參照,RTN再次把當前位置放到棧中,然后再跳回NP的開始處。
由于RTN與上下文無關(guān)語法是完全等價的,所以遍歷一個RTN就可以想像成是使用一個上下文無關(guān)規(guī)則來進行簡單的自頂向下剖析的過程,而且這個過程可以用圖表示出來。在描述或顯示一個語法時,通??梢允褂肦TN作為一個恰當?shù)谋扔鲌D示,或者作為實現(xiàn)具有小量遞歸但又不是有限狀態(tài)的系統(tǒng)的一種方法。
責(zé)任編輯:admin