簡單的（非平滑的）N元語法應(yīng)用于選詞

發(fā)布時間： 2022-07-11 09:29:19 作者：etogether.net 來源：網(wǎng)絡(luò) 瀏覽次數(shù)：

我們可以把二元語法模型（只看過去的一個單詞）推廣到三元語法模型（看過去的兩個單詞），再推廣到N元語法模型（看過去的N-1個單詞）。二元語法模型稱為一階馬爾可夫模型（因為它只看過去的一個詞例），三元語法模型稱為二階馬爾可夫模型，N元語法模型稱為N-1階馬爾可夫模型。直到1958年Chomsky發(fā)表對Skinner的Verbal Behavior(言語行為）評論之前，單詞的馬爾可夫模型在工程技術(shù)、心理學和語言學中得到了普遍應(yīng)用，但是后來不再流行了。IBM公司的Thomas J. Watson研究中心語音識別實驗室應(yīng)用N元語法模型在語音識別中取得了很大的成績，馬爾可夫模型又重新引起了學術(shù)界的注意。

在一個序列中，N元語法對于下一個單詞的條件概率逼近的通用等式是：

6.8.png

式（6.8）說明，對于所有給定的前面的單詞，單詞w n。的概率可以只通過前面N個單詞的概率來逼近。

對于二元語法來說，我們把式（6.8）代入式（6.5），就可以計算出整個符號串的概率。結(jié)果如下：

6.9.png

讓我們來看語音理解系統(tǒng)中的一個例子。Berkeley Restaurant Project(Berkeley飯店規(guī)劃）是一個基于語音的飯店咨詢系統(tǒng)，用戶可以通過這個系統(tǒng)詢問關(guān)于California州Berkeley飯店的問題，系統(tǒng)從地方飯店的數(shù)據(jù)庫中檢索合適的信息顯示給用戶（Jurafsky et al.,1994）。這里是用戶提問的一些樣本：

I'm looking for Cantonese food.

（我在找廣東菜的飯店。）

I'd like to eat dinner someplace nearby.

（我喜歡在附近的地方吃晚餐。）

Tell me about Chez Panisse.

（請告訴我關(guān)于Chez Panisse飯店的情況。）

Can you give me a listing of the kinds of food that are available?

（你可以給我已經(jīng)準備好的各種食品的清單嗎？）

I'm looking for a good place to eat breakfast.

（我正在找一個適合吃早飯的地方。）

I definitely do not want to have cheap Chinese food.

（我確實不想吃便宜的中國食品。）

When is Caffe Venezia open during the day?

（近來Venezia咖啡店什么時候開門？）

I don't wanna walk more than ten minutes.

（走10分鐘以上的地方我不想去。）

圖6.2中的表是關(guān)于二元語法概率的一個樣本，它說明了在單詞eat之后可能出現(xiàn)的某些單詞的概率，這些概率是從用戶所說的句子中統(tǒng)計得出的（現(xiàn)在我們不考慮訓練二元語法概率的算法）。注意，這些概率編碼說明了某些事實，這些事實是：在本質(zhì)上很嚴格的句法事實（在eat之后常常

會是一個名詞短語的開頭，例如形容詞、修飾詞或名詞等）以及某些與文化有關(guān)的事實（在英國詢問如何找英國食品的概率是很低的）。

圖6.2.png

圖6.2 Berkeley Restaurant Project 中說明eat后最容易出現(xiàn)的單詞的二元語法的一個片斷

[上一頁][1] [2] [3] [下一頁] 【歡迎大家踴躍評論】

上一篇：上下文有關(guān)的錯拼更正算法
下一篇：拼寫錯誤檢查算法的文獻和歷史說明

《譯聚網(wǎng)》倡導尊重與保護知識產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)問題，煩請30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至info@qiqee.net，我們將及時溝通與處理。

把腿张开老子臊烂你多p视频软件,free性国产高清videos,av在线亚洲男人的天堂,hdsexvideos中国少妇,俄罗斯真人性做爰

簡單的（非平滑的）N元語法應(yīng)用于選詞

相關(guān)機器翻譯技術(shù)文章

免費在線翻譯

翻譯機

外語書籍

行業(yè)文章

人工翻譯