- 簽證留學 |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語 |
- 德語
發(fā)音詞典實際上既可以用于ASR(自動語音識別)系統(tǒng),也可以用于TTS(文本-語音轉換)系統(tǒng),盡管由于這兩種系統(tǒng)的需要不同,發(fā)音詞典的內(nèi)容可能會有所不同。
最簡單的發(fā)音詞典只包含由單詞及其發(fā)音組成的一個詞表。
這樣的大規(guī)模的在線發(fā)音詞典有三部,分別是PRONLEX,CMUdict和CELEX。它們可用于語音識別,也可以用于語音合成。PRONLEX發(fā)音詞典(LDC,1995)是為語音識別而設計的,包含90694個詞形的發(fā)音,可覆蓋多年來在華爾街日報語料庫和Switchboard語料庫(Switchboard Corpus)中使用的單詞。CMUdict發(fā)音詞典也是為自動語音識別(ASR)的目的而開發(fā)的,包含大約100000個詞形的發(fā)音。CELEX發(fā)音詞典(Celex,1993)包括《牛津高級英語學習詞典》(1974)(41000個原形詞)和《朗文現(xiàn)代英語詞典》(1978)(53000個原形詞)的全部單詞,總共包含160595個詞形的發(fā)音。CELEX發(fā)音詞典是英國英語發(fā)音,其他兩部發(fā)音詞典是美國英語發(fā)音。每部發(fā)音詞典所用的音子集(phone set)不一樣,CMU和PRONLEX的音子集是從ARPAbet推出來的,CELEX 的音子集是從IPA推出來的。三部發(fā)音詞典都把重音表示為三層:主重音、次重音和無重音。圖2 說明了armadillo這個詞在三部發(fā)音詞典中的發(fā)音情況。
圖2 在三部詞典中單詞armadillo的發(fā)音。我們不解釋這些特殊的發(fā)音符號,對于每種發(fā)音都給出了等價的IPA音標。在CMU發(fā)音詞典中,對于非重讀元音([a],[等),用0級重音來表示。在IPA標音中,在元音下面加下劃線來表示。注意,在英國英語的CELEX的發(fā)音中r-脫落的現(xiàn)象以及元音使用[??]而不使用[o?]的表示方法