- 簽證留學 |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語 |
- 德語
一個更嚴重的問題是語義角色只能在語義到句法的一般映射中擔當很小的角色。這是因為語義角色只與NP和PP論元的語法角色的確定有關,并不參與動詞的其他論元和其他謂詞的實現(xiàn)。這種可能的論元已有許多,比如句子的補語(Sfin,Swh-,Sforto),動詞短語(VPbrst, VPto等)或引用(Quo)。而且,語義角色只對動詞論元的映射起作用,但是其他詞類, 例如名詞也有論元(destruction of the city,father of the bride)。
對語義角色的這些問題有許多可能的處理方法。許多系統(tǒng)以實用為目的而繼續(xù)使用它們,比如在機器翻譯中作為中間語言或在淺層語義詮釋中作為適宜的語義層。其他研究者認為語義角色應該被看成是一種附帶的現(xiàn)象,而不是一個獨特的表示層。例如,跟隨Foley and van Valin(1984),Dowty(1991)認為語義角色不是一組集合,而是只有兩個組合的概念:原型施事(PROTO-AGENT)和原型受事(PROTO-PATIENT)。確定一個動詞的論元是否是原型施事,可以從動詞的深層概念的結構意義的蘊涵中得到預測。概念結構中的語義角色與語法功能之間的映射可以通過簡單的規(guī)則進行(最可能是原型施事的論元是主語,最可能是原型受事的論元是賓語,或被動句中的主語)。Dowty的兩個規(guī)則導致直接指向動詞的深層概念結構,因此語義角色完全不再出現(xiàn)于任何表示層中。
Dowty模型的一個缺陷是從事件及其參與者的潛在概念結構不能總是預測出語義角色。例如,F(xiàn)illmore(1977)指出能夠描述同一商業(yè)事件(commercial event)的不同動詞可以選擇不同的方式來表達事件的參與者。例如,在Amie和Benson之間涉及3美元和1個三明治的交易可以用下面任意一種方式來描述:
動詞buy,sell和pay,選擇商業(yè)事件的不同視角,并選擇潛在參與者與題元角色的不同映射來實現(xiàn)這種視角。這三個動詞具有完全不同的映射的事實暗示:動詞的語義角色必須在動詞的詞典條目中列出,從潛在的概念結構是不能預測的。
這個事實,再加上前面所提到的動詞交替不能完全從語義角色預測的事實(例如donate這樣的特例),導致許多研究者認為任何有用的計算詞典都需要列出每個動詞(或形容詞或其他謂詞)句法和語義的組合的可能性。對每個動詞列出組合可能性的另一個好處是也可以給出每個語義框架的概率。
FrameNet項目(Baker et al.,1998;Low et al.,1997)是近期為列出英語中許多謂詞的這些元素而做的一次嘗試。一個詞的FrameNet條目列出了它所帶的每個論元集,包括語義角色、句法短語和它們的語法功能的可能集合。FrameNet中所用到的語義角色遠比我們曾描述過的那十個例子更具體。每個FrameNet的語義角色被定義為框架(frame)的一部分,而每個框架又是領域的一部分。例如,認知(Cognition)領域存在一些框架,包括靜態(tài)認知(static cognition)(比如believe,think 和understand),思考(cogitation)(比如brood,ruminate)和判斷(judgment)(比如accuse,admire 和rebuke)等框架。所有的認知框架都定義語義角色COGNIZER。在判斷框架中,COGNIZER被指向JUDGE,該框架也包括一個EVALUEE,一個REASON和一個ROLE,這里是幾個例子(Johnson,1999):
Judge Kim respects Pat for being so brave
Evaluee Kim respects Pat for being so brave
Reason Kim respects Pat for being so brave
Role Kim respects Pat as a scholar
圖16.10
每個條目也被標注了上圖116.10中所描述的短語類型以及語法功能(主語、賓語或補語)。例如,這里是判斷動詞appreciate的部分FrameNet條目,我們只給出該動詞的主動涵義,完整的條目也包括被動涵義。下面的例句(有的經(jīng)過裁剪)來自英國國家語料庫(British National Corpus):
對應地,動詞appreciate的另一個涵義是作為類似understand的靜態(tài)認知的動詞,靜態(tài)認知動詞具有諸如COGNIZER和CONTENT之類的角色,這里是一些例子:
研究這些例句可以清楚地得出一些關于不同語義角色的實現(xiàn)的普遍性原則。JUDGE,COGNIZER和AGENT一般常實現(xiàn)為主動句的主語。ROLE常實現(xiàn)為介詞as的PP。CONTENT常實現(xiàn)為某種類型的S。在這種細粒度的層次上表示語義角色則可使指向句法的映射更清晰。
為了給句子自動指派語義角色,Gildea et al.(2000)給出了一個利用FrameNet 訓練的隨機算法。對每個待標的成分,算法計算每個可能的語義角色的概率。這些概率,利用手工標注的FrameNet數(shù)據(jù)庫進行訓練,與動詞、待標成分的中心語、動詞的語義(主動,被動)以及待標成分的句法范疇(NP,S和PP等)和語法功能(主語,賓語)有關。
像FrameNet這樣的方案的主要不足在于,在定義每個領域、每個框架的語義角色時需要大量的人力。Riloff and Schmelzenbach(1998)給出了一個基于語料庫的方法,以便于從未標注文本中獲取語義角色集。
責任編輯:admin