講演名 | 1996/12/12 発音ネットワークに基づく発音辞書の自動生成 深田 俊明, 匂坂 芳典, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 自然発話音声では,読み上げ発声では起こらないような,大きな発声変形を生じることがある.このような発声を音声認識しようとした場合,標準的な読みが付与された発音辞書を用いても,正しい認識結果は得られない.つまり,標準的な発音系列と実際に発声される発音系列のミスマッチを緩和する機構が必要である.本稿では,発声内容を標準的な辞書表記に基づいて書き起こした音素系列を標準発音系列とし, この発声を音素認識した結果の音素系列を修正発音系列と見なし, これらの対応関係を発音ネットワークとして構築し, この発音ネットワークを利用して発音辞書を自動的に生成する方法について述べる.本手法は, (1)学習データ中の発声数が少ない語彙に対しても信頼性の高い発音記号列が得られる, (2)任意の認識対象語彙の追加に対して,発音辞書を生成することができるなどの特徴をもつ.自然発話音声認識実験から, この発音ネットワークに基づいて自動生成した発音辞書は,認識性能,認識時間の両面において,従来の標準発音列に基づいた辞書よりも優れていることが分かった. |
抄録(英) | In spontaneous speech, word pronunciations vary more than in read speech, while only standard pronunciations in citation form are used in most Japanese recognition systems disregarding real pronunciation variations. To cope with pronunciation variations in spontaneous speech, it is important to build a pronunciation dictionary from real speech data. In this paper, we propose an automatic generation method of a pronunciation dictionary based on pronunciation networks which give the most plausible pronunciations (henceforth correct pronunciations). First, phoneme recognition results are taken as the correct pronunciations. Then pronunciation networks are trained using multi-layer perceptron neural networks to predict these correct pronunciations from the canonical symbol sequences. Finally, pronunciation dictionaries are automatically generated from the pronunciation networks. Experimental results on spontaneous speech show that the automatically-derived pronunciation dictionaries give consistently higher recognition rates and require less computational time for recognition than the conventional dictionary. |
キーワード(和) | 発音辞書 / ニューラルネットワーク / 自然発話音声 / HMM / 音声認識 |
キーワード(英) | pronunciation dictionary / neural networks / spontaneous speech / HMM / speech recognition |
資料番号 | NLC96-40,SP96-71 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 1996/12/12(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 発音ネットワークに基づく発音辞書の自動生成 |
サブタイトル(和) | |
タイトル(英) | Automatic Generation of Pronunciation Dictionary Based on Pronunciation Networks |
サブタイトル(和) | |
キーワード(1)(和/英) | 発音辞書 / pronunciation dictionary |
キーワード(2)(和/英) | ニューラルネットワーク / neural networks |
キーワード(3)(和/英) | 自然発話音声 / spontaneous speech |
キーワード(4)(和/英) | HMM / HMM |
キーワード(5)(和/英) | 音声認識 / speech recognition |
第 1 著者 氏名(和/英) | 深田 俊明 / Toshiaki Fukada |
第 1 著者 所属(和/英) | ATR音声翻訳通信研究所 ATR Interpreting Telecommunications Research Laboratories |
第 2 著者 氏名(和/英) | 匂坂 芳典 / Yoshinori Sagisaka |
第 2 著者 所属(和/英) | ATR音声翻訳通信研究所 ATR Interpreting Telecommunications Research Laboratories |
発表年月日 | 1996/12/12 |
資料番号 | NLC96-40,SP96-71 |
巻番号(vol) | vol.96 |
号番号(no) | 419 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |