- 簽證留學(xué) |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語 |
- 德語
ヨe,x,y Eating(e) ∧ Eater(e,x) ∧ Theme(e,y) ∧ Isa(y,EdibleThing)
當(dāng)遇到像ate a hamburger這樣的短語,語義分析器能夠形成如下的表示:
ヨe,x,y Eating(e) ∧ Eater(e,x) ∧ Theme(e,y) ∧ Isa(y,EdibleThing) ∧ Isa(y,Hamburger)
這個(gè)表示是完全合理的,因?yàn)榧偃缭谥R庫中有一個(gè)合理的事實(shí)集,y在范疇Hamburger中的成員屬性與它在范疇Edible'Thing中的成員屬性是一致的。相應(yīng)地,諸如ate a take of的短語的表示將是非良構(gòu)的,因?yàn)樵谝粋€(gè)類似事件的范疇,比如Takeoff中的成員屬性與范疇EdibleThing中的成員屬性不一致。
盡管該方法足夠捕捉選擇限制的語義,但直接使用時(shí)仍存在兩個(gè)問題。首先,采用FOPC來進(jìn)行施加選擇限制的簡單任務(wù)有“牛刀殺雞”之嫌。完全可以采用更簡單的形式體系,通過較少的計(jì)算開銷來實(shí)現(xiàn)。第二個(gè)問題是,該方法預(yù)先假定存在一個(gè)大規(guī)模的關(guān)于組成選擇限制的概念的事實(shí)邏輯知識庫。遺憾的是,盡管這類知識庫正在建設(shè),但是還沒有普遍使用,而且?guī)缀鯖]有達(dá)到任務(wù)所需規(guī)模的知識庫。
一個(gè)更實(shí)際的方法,至少對英語來說,是利用WordNet信息庫中的上下位關(guān)系。在該方法中,語義角色的選擇限制是用WordNet的同義集而不是邏輯概念來表述的。如果填充語義角色的詞位是由謂詞給語義角色指定的同義集的上位詞中的一個(gè),則這個(gè)給定的意義表示可以被判斷為良構(gòu)的。
研究該方法用于下面的ate a hamburger例子的情形。在WordNet的60000個(gè)同義集中,包括下面的一個(gè)注釋為:any substance that can be metabolized by an organism to give energy and build tissue(任何能夠被生物體新陳代謝以供給能量和構(gòu)建組織的物質(zhì))的同義集:
{food, nutrient }
有了這個(gè)同義集,我們可以將它指定為對動(dòng)詞ear的THEME角色的選擇限制,也就是將這個(gè)角色的填充者限定為在這個(gè)同義集或其下位詞中。幸運(yùn)的是,圖16.10中hamburger的上位關(guān)系鏈,顯示hamburger確實(shí)是食物。
圖16.10 WordNet中有關(guān)Hamburger可食用的根據(jù)
注意,在該方法中并不需要角色的填充者與限定的同義集之間嚴(yán)格匹配,而是只要填充者把限定同義集作為它的最終上位詞中的一個(gè),就可以滿足選擇限制。在hamburger的例子中,選擇限定同義集比hamburger高出5個(gè)上位關(guān)系層。
當(dāng)然,這種方法也容許單個(gè)詞位在不同的具體化層次滿足限制。例如,研究將該方法用于我們早先討論過的動(dòng)詞imagine, lift和diagonalize的THEME角色時(shí)的情形。讓我們將imagine的THEME角色限制為同義集{entity,something},lijft的THEME角色限制為同義集{object,physical object}, diagonalize角色限制為{matrix}。這種處理正確地容許 imagine a hamburger和lift a hamburger;而
且也正確地排除了 diagonalize a hamburger。
注意,這個(gè)方法依賴于在WordNet中出現(xiàn)的詞位恰好能夠指定所有可能的選擇限制所需的準(zhǔn)確概念。遺憾的是,我們并沒有十足的理由相信在一個(gè)語言中用于選擇限制的概念集恰好能夠被這個(gè)語言中的詞位所包容。在WordNet中通過使用搭配(比如physical object和snack food),在一定程度上改善了這種情形。
下面更直接地說明這個(gè)問題,有許多分類體系介于諸如CYC(Lenat and Guha,1991)的常識知識庫和諸如WordNet的詞典庫之間。這些混合模型中所包含的客體,不一定對應(yīng)于單個(gè)詞典項(xiàng),而是對應(yīng)于與語法和語義相關(guān)的那些概念。在大多數(shù)情況下,這些分類體系的上層部分用于表示領(lǐng)域和語言無關(guān)的概念,比如,物體、狀態(tài)、事件和有生性等。PENMAN Upper Model是這些分類體系中最成熟的模型之一。
責(zé)任編輯:admin