- 簽證留學(xué) |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語(yǔ) |
- 德語(yǔ)
HMM詞表結(jié)構(gòu)用手工來(lái)建立,工作時(shí)要使用一部非定制發(fā)音詞典,如PRONLEX詞典(LDC.1995)或CMUdict詞典。在有些系統(tǒng)中,詞典中的每個(gè)音子都要映射到HMM模型的狀態(tài)中。這樣,單詞cat對(duì)應(yīng)于[k],[ae]和[t]三個(gè)狀態(tài)。但是,很多系統(tǒng)使用我們前面描述的次音子結(jié)構(gòu),其中每個(gè)音子被分割為三個(gè)狀態(tài):音子的開(kāi)始部分、中間部分和最后部分。每個(gè)這樣的次音子還可以進(jìn)一步在三音子上下文中出現(xiàn)不同的實(shí)例。
HMM參數(shù)的嵌入訓(xùn)練細(xì)節(jié)各不相同,這里介紹最簡(jiǎn)單的一種。首先,我們需要轉(zhuǎn)移概率aij和觀察概率bj(ot)的某些初始估計(jì)值。對(duì)于轉(zhuǎn)移概率,起初假定對(duì)于任何狀態(tài)的所有可能的下一個(gè)狀態(tài)的值都是等概率的。觀察概率可以從一個(gè)手工標(biāo)注的小語(yǔ)料庫(kù)開(kāi)始,一步一步地使用自舉
(bootstrapped)的方法訓(xùn)練得到。例如,TIMIT語(yǔ)料庫(kù)或Switchboard語(yǔ)料庫(kù)各有4小時(shí)的經(jīng)過(guò)語(yǔ)音標(biāo)注的口語(yǔ)語(yǔ)料。它們可以為每個(gè)語(yǔ)音框架提供一個(gè)“正確”的音子狀態(tài)標(biāo)記q。這些都可以送到MLP中,或者求其平均給出初始高斯平均值和方差。對(duì)于MLP,初始的估計(jì)是很重要的,所以手工標(biāo)注的自舉結(jié)果(bootstrap)就成為了其后的規(guī)范。對(duì)于高斯模型,參數(shù)的初始值看來(lái)不那么重要,所以高斯模型的初始平均值和方差通常只是一個(gè)集合,在使用整個(gè)訓(xùn)練集的平均值和方差時(shí),這個(gè)集合對(duì)于所有的狀態(tài)都是等同的。
現(xiàn)在,對(duì)于所有的概率a和b,我們有了初始的估計(jì)。在算法的下一個(gè)階段,高斯模型和MLP系統(tǒng)各不相同。對(duì)于MLP系統(tǒng),我們使用一種稱(chēng)為“強(qiáng)制Viterbi對(duì)齊”(forced Viterbi alignment)的方法。強(qiáng)制Viterbi對(duì)齊取語(yǔ)段中正確單詞的序列作為輸入,將其與聲譜特征矢量對(duì)齊。這樣能夠產(chǎn)生HMM狀態(tài)的最佳序列,其中的每個(gè)狀態(tài)與一個(gè)特征矢量對(duì)齊。因此,強(qiáng)制Viterbi對(duì)齊是正規(guī)Viterbi解碼算法的一種簡(jiǎn)化,因?yàn)樗恍枰谐稣_的音子序列,而不必找出單詞序列。之所以稱(chēng)之為“強(qiáng)制”的,是因?yàn)槲覀兘o算法強(qiáng)加了某種約束,要求最佳路徑必須通過(guò)一個(gè)特定的單詞序列。它還要求使用Viterbi算法,因?yàn)閱卧~有多個(gè)發(fā)音,并且每個(gè)音子的音延是不固定的。強(qiáng)制Viterbi對(duì)齊的結(jié)果是帶有“正確”音子標(biāo)記的特征矢量的集合,這個(gè)集合可以用來(lái)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行再訓(xùn)練。強(qiáng)制對(duì)齊中的轉(zhuǎn)移計(jì)數(shù)可以用來(lái)估計(jì)HMM的轉(zhuǎn)移概率。
對(duì)于高斯HMM模型,我們不使用強(qiáng)制Viterbi對(duì)齊,而使用向前-向后算法。對(duì)于給定的初始概率a和b,我們對(duì)每個(gè)句子計(jì)算它的向前概率和向后概率。正如在MLP中的情況,向前-向后算法也需要使用我們對(duì)于正確單詞的知識(shí)來(lái)加以約束。對(duì)于給定的模型A,用向前-向后算法來(lái)計(jì)算它的概率。在被轉(zhuǎn)寫(xiě)的句子中,使用“已知”的單詞序列的知識(shí),從而能夠知道,對(duì)于所有的符號(hào)串,什么樣的單詞模型可以使我們得到模型A,然后用這個(gè)模型來(lái)對(duì)每個(gè)句子的向前和向后概率進(jìn)行計(jì)算。
責(zé)任編輯:admin