- 簽證留學(xué) |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語(yǔ) |
- 德語(yǔ)
在這個(gè)句子中,介詞短語(yǔ)into Afghanistan或者附著于more than 100,000 soldiers這個(gè)NP,或者附著于以sent為中心語(yǔ)的動(dòng)詞短語(yǔ)。在PCFG中,附著關(guān)系的選擇歸結(jié)為在下面兩個(gè)規(guī)則之間的選擇:一個(gè)規(guī)則是NP→NP PP(NP附著),一個(gè)規(guī)則是VP→VPPP(VP附著)。這兩個(gè)規(guī)則的概率依賴(lài)于訓(xùn)練語(yǔ)料庫(kù);Hindle and Rooth(1999)報(bào)告,根據(jù)對(duì)AP新聞專(zhuān)線(xiàn)1300萬(wàn)單詞的語(yǔ)料庫(kù)統(tǒng)計(jì),NP附著占67%,VP附著占33%;Collins(1999)報(bào)告,在混合了《華爾街日?qǐng)?bào)》和《IBM計(jì)算機(jī)手冊(cè)》的語(yǔ)料庫(kù)中,NP附著占了52%。無(wú)論NP附著的優(yōu)先性是52%還是67%,關(guān)鍵的是在PCFG中這個(gè)優(yōu)先性是純結(jié)構(gòu)的,而且對(duì)于所有動(dòng)詞都是相同的。
但是,在例句(12.17)中,PP的正確附著卻是在動(dòng)詞上,是VP附著。在這種情況下,因?yàn)閯?dòng)詞send的次范疇需要表示“方向”,而“方向”正好通過(guò)介詞into來(lái)表示。在Penn樹(shù)庫(kù)的Brown語(yǔ)料庫(kù)和WSJ語(yǔ)料庫(kù)關(guān)于動(dòng)詞的語(yǔ)料中,與主要?jiǎng)釉~send有關(guān)的介詞into的所有歧義的PP附著全都附著于動(dòng)詞。在這種情況下,只有針對(duì)不同的動(dòng)詞建立不同的詞匯依存關(guān)系(lexical dependency)的統(tǒng)計(jì)模型,才能正確地選擇剖析的結(jié)果。
詞匯依存關(guān)系是選擇正確剖析的關(guān)鍵,這一點(diǎn)還表現(xiàn)在聯(lián)合結(jié)構(gòu)歧義(coordination ambiguity)的問(wèn)題上。圖1是來(lái)自Collins(1999)的一個(gè)例子,短語(yǔ)dogs in houses and cats有兩個(gè)不同的剖析。由于dogs在語(yǔ)義上更容易與cats結(jié)合,而不與houses結(jié)合(并且也由于dogs不可能處于cats的體內(nèi)),所以[dogs in[NP houses and cats]]在直覺(jué)上就是不自然的,因而不能選擇為剖析結(jié)果。然而,圖1中的兩個(gè)剖析使用的PCFG規(guī)則完全相同,所以PCFG將給它們指派相同的概率。
圖1聯(lián)合結(jié)構(gòu)歧義的一個(gè)例子。盡管左邊的結(jié)構(gòu)在直覺(jué)上是正確的,但是PCFG將給左右兩個(gè)結(jié)構(gòu)都指派相同的概率,因?yàn)閮蓚€(gè)結(jié)構(gòu)使用的規(guī)則完全相同(Collins,1999)
總而言之,概率上下文無(wú)關(guān)語(yǔ)法作為句法的一個(gè)概率模型存在著一系列不足。
責(zé)任編輯:admin