- 簽證留學 |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語 |
- 德語
這里要介紹神經(jīng)網(wǎng)絡使用的一種方法,稱為“混合隱馬爾可夫-多層感知器方法”(簡稱混合HMM-MLP方法)。這種方法使用了HMM的一些成分(例如單詞發(fā)音的狀態(tài)圖表示),但觀察概率的計算使用了MLP,而不使用高斯混合法。這些MLP輸入是在時間t的信號表示以及包圍該信號的一個窗口框架(又稱為“幀”);例如,這可以是在時間t的一個聲譜特征矢量再加上在時間t+10ms, t+20ms, t+30ms, t+40ms, t-10ms等的8個附加矢量。這樣,神經(jīng)網(wǎng)絡的輸入是9個矢量,對于一個時間片,每個矢量有一整套實數(shù)值聲譜特征。網(wǎng)絡對于每個音子有一個輸出單元,作為對輸出值的限制,所有輸出單元的值的總和應該為1,這樣的網(wǎng)絡可以用來計算對于給定的觀察矢量Ot,狀態(tài)j的概率P(jlOt)。圖1是這種網(wǎng)絡的一個樣本。
圖1 用于估計音子狀態(tài)概率的神經(jīng)網(wǎng)絡。這個網(wǎng)絡可以在不同于高斯模型的HMM模型中使用,這個特定的網(wǎng)絡來自Bourlard and Morgan(1994)描寫的MLP系統(tǒng)。給定一個框架的特征矢量以及分別在它兩側的特征矢量(每側有4個框架),可以估計出概率P(qjlOt)。應用貝葉斯公式,可以把這個概率轉化為觀察似然度的估計b=p(Otlqj)。這些網(wǎng)絡是使用錯誤反向傳播算法訓練出來的,而這個算法是用于高斯模型的嵌人訓練算法的一部分
對于給定的一個觀察Ot,MLP計算HMM狀態(tài)j的概率P(qjlOt)。但是,對于HMM的觀察概率函數(shù)bj(Ot),我們需要的觀察似然度是p(Otlqj)。貝葉斯公式可以幫助我們認識到怎樣從P(qjlOt)來計算P(Otlqj)。網(wǎng)絡要計算的是:
我們可以把各項重新安排如下:
式(7.14)右邊的兩項可以直接通過MLP來計算;分子就是MLP的輸出,分母是給定狀態(tài)的全部概率,也就是所有的觀察加起來的概率,即σj(t)的所有t的總和。這樣,盡管我們不能直接計算P(Otlqj),但可以使用式(7.14)計算,根據(jù)計算結果就得出了“按比例的似然度”p(o1)(scaled likelihood),它等于似然度被觀察概率來除所得的值。實際上,這個按比例的似然度就像正規(guī)的似然度一樣好,因為在識別過程中觀察概率p(Ot)是一個常數(shù),它不會妨礙我們得到應得的結果。
訓練MLP的誤差反向傳播算法要求我們知道對于每個觀察Ot的正確音子標記qj。給定一個很大的觀察訓練集和正確的標記,算法反復地調整MLP中的權值,以減少訓練集的錯誤。
責任編輯:admin