- 簽證留學(xué) |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語 |
- 德語
基于成分的語法可以使用中心語之間的概率關(guān)系來增強,并且指出詞匯依存信息在模擬中心語(如動詞)對于它們的論元或修飾語的詞匯約束時是非常重要的。
語法形式化的一個重要類別就是純粹建立在詞匯依存信息基礎(chǔ)上的。在這些依存語法中,成分和短語結(jié)構(gòu)規(guī)則沒有任何根本性的作用。依存語法不用成分和短語結(jié)構(gòu)規(guī)則,一個句子的句法結(jié)構(gòu)完全由單詞和這些單詞之間的二元語義或句法關(guān)系來描寫。依存語法主要來自Tesniere(1959)的工作,而“依存”這個詞可以假定為首先由David Hays使用。不過,語法的詞匯依存概念事實上比相對現(xiàn)代的短語結(jié)構(gòu)或組成性語法早一些,這樣的概念在古希臘和印度的語言學(xué)傳統(tǒng)中就有了。傳統(tǒng)語法關(guān)于“把一個句子剖析為主語和謂語”的概念顯然是建立在詞匯關(guān)系的基礎(chǔ)上,而不是建立在成分關(guān)系的基礎(chǔ)上的。
圖1是使用Jarvinen and Tapanainen(1997)和Karlsson et al.(1995)的依存語法形式化方法來剖析句子I gave him my address的結(jié)果。注意,這里沒有非終極結(jié)點或短語結(jié)點;在剖析樹中的每個鏈接只在兩個詞匯結(jié)點之間存在(用了一個特殊的結(jié)點<ROOT>來增強這種表示方法)。這些鏈接是從包含35種關(guān)系的一個固定清單中提取的,這些關(guān)系中的大多數(shù)大致表示了語法功能或很普通的語義關(guān)系。其他基于依存的計算語法,例如鏈語法(link grammar XSleator and Temperley, 1993),使用了不同的但大致交迭的鏈接。下面的表列出了Jarvinen and Tapanainen(1997)使用的一些依存關(guān)系:
圖1 使用了Karlsson et al.(1995)的依存形式化方法的依存語法剖析的一個樣本(J?rvinen and Tapanainen,1997)
我們已經(jīng)討論了為什么依存關(guān)系信息是很重要的。只使用依存信息而忽略組成性,是否還有其他任何好處呢?依存語法的研究者主張,純粹的依存語法的一個最主要的好處是它們有能力來處理具有相對自由詞序的語言。例如,像捷克語這樣的語言的詞序比英語靈活得多;一個賓語可以處于地點狀語或謂語體詞comp之前,也可以處于它們之后。當(dāng)剖析樹中出現(xiàn)這種狀語短語時,對于每個可能的不同位置,短語結(jié)構(gòu)語法都需要分別用不同的規(guī)則來處理。而對于這種特定的狀語關(guān)系,依存語法只需要一個鏈接類型就可以代表了??梢?,依存語法對不同的詞序變化進行了抽象,只表示對于剖析必需的那些信息。
已經(jīng)有一些在計算機上實現(xiàn)依存語法的研究成果;鏈語法(Link Grammar)(Sleator and Temperley,1993)和約束語法(Constraint Grammar) (Karlsson et al.,1995)都是使用方便、覆蓋面廣的依存語法和英語的剖析器。依存語法也用于處理其他語言。例如,Hajic(1998)描寫了含有500000個單詞的捷克語的Prague依存樹庫,這個樹庫被用于訓(xùn)練概率依存剖析器(Collins et al.,1999)。
責(zé)任編輯:admin