- 簽證留學(xué) |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語 |
- 德語
在此將探討識別代詞的先行詞的一種簡單方法。最簡單的方法是歷史記錄列表,它是在前面句子基礎(chǔ)上生成的篇章實體的列表。根據(jù)前文的介紹,歷史記錄列表就是一個結(jié)構(gòu)的序列,這些結(jié)構(gòu)對應(yīng)于前面局部上下文的篇章實體。列表中首先列出來自于當(dāng)前局部上下文的實體(即前一個子句生成的實體),然后是前一個句子的局部上下文中的實體,依次類推。
我們知道代詞可指代同一個句子中的對象,并推導(dǎo)出了一系列共指約束。這些約束說明,在同一個句子中,每個代詞的先行詞可能或者不可能是哪些對象。這些約束也影響了句子之間的情況。例如,即使在不同句子之間出現(xiàn)的同一個對象,自反性約束也存在,如下面的篇章:
11a. Jack saw Sam at the party. (在晚會上Jack看見了Sam。)
11b. Sam gave him a drink. (Sam給了他飲料。)
在這個例子中,自反性約束表明“him”和11b中的“Sam”不能互指。這也禁止了代詞“him”與句子11a中的由“Sam”引發(fā)的篇章實體互指。
代詞的可能的先行詞并不限于在局部上下文中出現(xiàn),但是局部上下文對解決代詞指代問題非常重要。代詞的大部分先行詞都出現(xiàn)在同一個句子中或局部上下文中。提及的先行詞離當(dāng)前篇章越遠(yuǎn),被某一代詞指代的可能性就越小。
一旦定義了由句子生成篇章實體的算法后,歷史記錄列表的概念就非常簡單。歷史記錄列表包括最近產(chǎn)生的所有篇章實體。一些系統(tǒng)允許最近一個或兩個局部上下文,而另外一些允許歷史記錄列表無限制增長。給定一個歷史記錄列表,搜索一個先行詞的算法描述如下:檢驗最近的局部上下文,發(fā)現(xiàn)滿足該代詞的所有約束的先行詞。約束可以來自于任何來源。例如,自反性約束將限制一些對象成為先行詞;性別和數(shù)的約束排除了另外一些對象;而施加選擇性的約束條件所產(chǎn)生的約束可能會進(jìn)一步引入其他約束。如果當(dāng)前局部上下文中沒有發(fā)現(xiàn)先行詞,則移到下一個最近的局部上下文中并進(jìn)行搜索。這一算法執(zhí)行了所謂的“最近約束”(recency constraint),該約束規(guī)定先行詞應(yīng)該是滿足所有約束的最近提及的對象。例如,下面關(guān)于帆船比賽的場景:
12a. The companies had a lot of money and spent lavishly on their boat.
(這些公司有很多錢,并花了很多錢在船上。)
12b. The boys, in contrast, built their boat on a tight budget.
(相反地,這些小孩卻只有很少的錢來造船。)
12c. They knew they would win the race easily.
(他們知道自己能夠很輕易地獲勝。)
盡管單純基于語義也可能是那些公司認(rèn)為他們自己能夠贏得比賽,但是句子12c中的“they”很可能還是指那些孩子。
句子12c的歷史記錄列表如圖1 所示。為了尋找代詞“they”的先行詞,可以尋找滿足代詞約束條件的歷史記錄列表中的第一個對象。在這種情況下,答案是滿足THEY1(x)的一個對象x,也就是任何一個復(fù)數(shù)的對象。第一個被檢驗的實體B2被選擇為一個指代對象。同樣的方法也可以應(yīng)用到定指性描述中。例如,如果句子12c為“They knew the boat would win easily”,那么“the boat”所指的是滿足約束BOAT(x)的第一個對象B3。
圖1 由篇章12生成的歷史記錄列表
在很多計算方法中,歷史記錄列表是一種基本的方法。我們必須進(jìn)一步改進(jìn)這一方法以便能夠處理特殊情況。
責(zé)任編輯:admin