把腿张开老子臊烂你多p视频软件,free性国产高清videos,av在线亚洲男人的天堂,hdsexvideos中国少妇,俄罗斯真人性做爰

會(huì)員中心 |  會(huì)員注冊(cè)  |  兼職信息發(fā)布    瀏覽手機(jī)版!    超值滿減    人工翻譯    英語(yǔ)IT服務(wù) 貧困兒童資助 | 留言板 | 設(shè)為首頁(yè) | 加入收藏  繁體中文
當(dāng)前位置:首頁(yè) > 機(jī)翻技術(shù) > 識(shí)別技術(shù) > 正文

語(yǔ)音識(shí)別系統(tǒng)的訓(xùn)練

發(fā)布時(shí)間: 2022-07-20 09:25:20   作者:etogether.net   來(lái)源: 網(wǎng)絡(luò)   瀏覽次數(shù):


HMM詞表結(jié)構(gòu)用手工來(lái)建立,工作時(shí)要使用一部非定制發(fā)音詞典,如PRONLEX詞典(LDC.1995)或CMUdict詞典。在有些系統(tǒng)中,詞典中的每個(gè)音子都要映射到HMM模型的狀態(tài)中。這樣,單詞cat對(duì)應(yīng)于[k],[ae]和[t]三個(gè)狀態(tài)。但是,很多系統(tǒng)使用我們前面描述的次音子結(jié)構(gòu),其中每個(gè)音子被分割為三個(gè)狀態(tài):音子的開(kāi)始部分、中間部分和最后部分。每個(gè)這樣的次音子還可以進(jìn)一步在三音子上下文中出現(xiàn)不同的實(shí)例。


HMM參數(shù)的嵌入訓(xùn)練細(xì)節(jié)各不相同,這里介紹最簡(jiǎn)單的一種。首先,我們需要轉(zhuǎn)移概率aij和觀察概率bj(ot)的某些初始估計(jì)值。對(duì)于轉(zhuǎn)移概率,起初假定對(duì)于任何狀態(tài)的所有可能的下一個(gè)狀態(tài)的值都是等概率的。觀察概率可以從一個(gè)手工標(biāo)注的小語(yǔ)料庫(kù)開(kāi)始,一步一步地使用自舉

(bootstrapped)的方法訓(xùn)練得到。例如,TIMIT語(yǔ)料庫(kù)或Switchboard語(yǔ)料庫(kù)各有4小時(shí)的經(jīng)過(guò)語(yǔ)音標(biāo)注的口語(yǔ)語(yǔ)料。它們可以為每個(gè)語(yǔ)音框架提供一個(gè)“正確”的音子狀態(tài)標(biāo)記q。這些都可以送到MLP中,或者求其平均給出初始高斯平均值和方差。對(duì)于MLP,初始的估計(jì)是很重要的,所以手工標(biāo)注的自舉結(jié)果(bootstrap)就成為了其后的規(guī)范。對(duì)于高斯模型,參數(shù)的初始值看來(lái)不那么重要,所以高斯模型的初始平均值和方差通常只是一個(gè)集合,在使用整個(gè)訓(xùn)練集的平均值和方差時(shí),這個(gè)集合對(duì)于所有的狀態(tài)都是等同的。


現(xiàn)在,對(duì)于所有的概率a和b,我們有了初始的估計(jì)。在算法的下一個(gè)階段,高斯模型和MLP系統(tǒng)各不相同。對(duì)于MLP系統(tǒng),我們使用一種稱(chēng)為“強(qiáng)制Viterbi對(duì)齊”(forced Viterbi alignment)的方法。強(qiáng)制Viterbi對(duì)齊取語(yǔ)段中正確單詞的序列作為輸入,將其與聲譜特征矢量對(duì)齊。這樣能夠產(chǎn)生HMM狀態(tài)的最佳序列,其中的每個(gè)狀態(tài)與一個(gè)特征矢量對(duì)齊。因此,強(qiáng)制Viterbi對(duì)齊是正規(guī)Viterbi解碼算法的一種簡(jiǎn)化,因?yàn)樗恍枰谐稣_的音子序列,而不必找出單詞序列。之所以稱(chēng)之為“強(qiáng)制”的,是因?yàn)槲覀兘o算法強(qiáng)加了某種約束,要求最佳路徑必須通過(guò)一個(gè)特定的單詞序列。它還要求使用Viterbi算法,因?yàn)閱卧~有多個(gè)發(fā)音,并且每個(gè)音子的音延是不固定的。強(qiáng)制Viterbi對(duì)齊的結(jié)果是帶有“正確”音子標(biāo)記的特征矢量的集合,這個(gè)集合可以用來(lái)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行再訓(xùn)練。強(qiáng)制對(duì)齊中的轉(zhuǎn)移計(jì)數(shù)可以用來(lái)估計(jì)HMM的轉(zhuǎn)移概率。


對(duì)于高斯HMM模型,我們不使用強(qiáng)制Viterbi對(duì)齊,而使用向前-向后算法。對(duì)于給定的初始概率a和b,我們對(duì)每個(gè)句子計(jì)算它的向前概率和向后概率。正如在MLP中的情況,向前-向后算法也需要使用我們對(duì)于正確單詞的知識(shí)來(lái)加以約束。對(duì)于給定的模型A,用向前-向后算法來(lái)計(jì)算它的概率。在被轉(zhuǎn)寫(xiě)的句子中,使用“已知”的單詞序列的知識(shí),從而能夠知道,對(duì)于所有的符號(hào)串,什么樣的單詞模型可以使我們得到模型A,然后用這個(gè)模型來(lái)對(duì)每個(gè)句子的向前和向后概率進(jìn)行計(jì)算。


責(zé)任編輯:admin


微信公眾號(hào)

[上一頁(yè)][1] [2] 【歡迎大家踴躍評(píng)論】
  • 上一篇:人的語(yǔ)音識(shí)別
  • 下一篇:聲學(xué)概率的計(jì)算


  • 《譯聚網(wǎng)》倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)問(wèn)題,煩請(qǐng)30天內(nèi)提供版權(quán)疑問(wèn)、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至info@qiqee.net,我們將及時(shí)溝通與處理。


我來(lái)說(shuō)兩句
評(píng)論列表
已有 0 條評(píng)論(查看更多評(píng)論)