- 簽證留學(xué) |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語 |
- 德語
中心的優(yōu)先考慮順序與句內(nèi)成分的可能解釋是如何相互影響的呢?要確定什么方法是最合適的,還要取決于對(duì)各種可能算法的進(jìn)一步研究和評(píng)價(jià)。目前,一些算法總是傾向于句子內(nèi)的指代對(duì)象,而另外一些算法則相反。一個(gè)有趣的組合是傾向于任何將代詞當(dāng)做中心的解釋,如果失敗,則傾向于句子內(nèi)的解讀而不是句子間的解讀。無論策略是什么,很重要的一點(diǎn)是,更一般的上下文因素最終決定了最好的解釋。任何只取決于結(jié)構(gòu)屬性的算法都是不完善的。
這說明,如果一個(gè)基于結(jié)構(gòu)的代詞消歧算法為每一個(gè)代詞都按優(yōu)先考慮的順序產(chǎn)生一個(gè)有序的可能指代對(duì)象序列,然后讓通用推理系統(tǒng)來做最后的決策,那么這種算法將是非常有用的。
尋找可能的先行詞
下面的例子說明了一個(gè)算法。該算法基于局部篇章上下文、共指約束和剛才討論的中心約束的一個(gè)子集,對(duì)每個(gè)代詞產(chǎn)生可能指代對(duì)象的一個(gè)有序列表。遺憾的是,由于共指約束,不存在一種方法可以獨(dú)立地處理每一個(gè)代詞。例如,在句子17b中,如果兩個(gè)代詞獨(dú)立解釋,每一個(gè)首選的指代對(duì)象將是局部上下文的中心,即“Jack”。但是,因?yàn)樽苑葱约s束的緣故,我們知道兩個(gè)代詞都不是指Jack。除了對(duì)每一個(gè)代詞的指代對(duì)象都列出所有組合情況外,在這個(gè)階段,還沒有什么辦法可以避免這個(gè)問題。在下面的算法中,將跳過這一問題。兩個(gè)代詞最可能指代對(duì)象“Jack”,我們將求助于推理系統(tǒng)中的共指約束和解釋過程。這樣,推理系統(tǒng)在最后決策時(shí),可能需要考慮中心約束3。這個(gè)算法的3個(gè)步驟如下:
1. 對(duì)每一個(gè)代詞產(chǎn)生可能先行詞的有序列表。
2. 用一般的推理來選擇合適的先行詞。
3. 用步驟2的結(jié)果來定義句子的Cb,并將其用做下一個(gè)句子的局部上下文的一部分。
圖3給出了步驟1的算法??疾炱?7中的算法,句子17a所生成的局部上下文如圖2所示。句子17b“He invited him to the party”的邏輯表達(dá)式如下:
(PAST(INVITEl il [AGENT (PRO h1 (&(HE1 h1) (# h1 h2)))]
[THEME(PRO h2(&(HE1 h2)(#h1 h2)))]
[PURPOSE
考慮代詞(PRO h1(&(HE1 h1)(≠h1 h2))),候選的初始列表包括Cb(Jack1),Cp(Jack1 again),句子內(nèi)的先行詞(為空)和其他篇章實(shí)體(Sam1,Park3),最后的列表為(Jack1 Sam1 Park3)。只有前兩個(gè)滿足h1上的約束,所以邏輯表達(dá)式更新為:
(PRO h1 HE1 (≠ h1 h2) (REF-LIST h1 (Jack1 Sam1)))
第二個(gè)代詞的處理過程類似,邏輯表達(dá)式更新為:
(PRO h2 HE1(≠ h1 h2)(REF-LIST h2(Jack1 Sam1)))
這一信息將傳遞給第2步中的通用推理系統(tǒng)。如果它與直覺相一致,則第2步認(rèn)定h1的先行詞為“Jack1”,h2的先行詞為“Sam1”。基于這樣的結(jié)果,我們可以確定當(dāng)前句子的中心,并且用做下一個(gè)句子的局部上下文。該算法的第3步如圖4所示,這一步實(shí)現(xiàn)了前面提到的中心約束理論。在前面的例子中,這一算法的執(zhí)行結(jié)果是“Jackl”被確定為新的Cb。
圖3為非反身代詞確定可能先行詞的算法
圖4識(shí)別新的Cb的算法
責(zé)任編輯:admin