講演名 2004/12/14
音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
蟻生 政秀, 益子 貴史, 田中 信一, 河村 聡典,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では話速に対してロバストな継続時間情報のモデル化手法について述ベる.本手法では,日本語のモーラ等時性から,各音節の相対的な継続時間は話速によらず一定であると仮定し,隣接する音節の継続長の比をモデル化する.これを音節継続長比モデルと呼び,隠れマルコフモデル(HMM)と組み合わせて用いることにより,HMMのみでは不十分であった継続時間情報を考慮した音声認識を行う.本手法の効果を確認するために,単語認識実験及び連続数字認識実験を行った.その結果,認識誤りは単語認識実験では最大で18%,連続数字認識実験では最大で28%減少した.また,音節単位の継続長モデルを用いた場合に比べ,学習データと話速が異なるデータに対しても効果のあることを確認した.
抄録(英) This paper describes a new duration model for speech recognition. Syllable duration ratio model is defined as a probability function for a duration ratio of neighboring syllables. The syllable duration ratio model can add duration information to speech recognition system, and is less subject to speech rate. The modeling technique is evaluated.in two tasks of speech recognition. In the experiments, the proposed model improves the speech recognition, although the speech rates of test data are different from that of training data.
キーワード(和) 音節 / 継続長 / 話速 / N-Best
キーワード(英) Syllable / Duration / Speech rate / N-Best
資料番号 NLC2004-73,SP2004-113
発行日

研究会情報
研究会 SP
開催期間 2004/12/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) A Study on Speech Recognition Using Syllable Duration Ratio Model
サブタイトル(和)
キーワード(1)(和/英) 音節 / Syllable
キーワード(2)(和/英) 継続長 / Duration
キーワード(3)(和/英) 話速 / Speech rate
キーワード(4)(和/英) N-Best / N-Best
第 1 著者 氏名(和/英) 蟻生 政秀 / Masahide ARIU
第 1 著者 所属(和/英) 東芝研究開発センター
Corporate Research & Development Center, Toshiba Corporation
第 2 著者 氏名(和/英) 益子 貴史 / Takashi MASUKO
第 2 著者 所属(和/英) 東芝研究開発センター
Corporate Research & Development Center, Toshiba Corporation
第 3 著者 氏名(和/英) 田中 信一 / Shinichi TANAKA
第 3 著者 所属(和/英) 東芝研究開発センター
Corporate Research & Development Center, Toshiba Corporation
第 4 著者 氏名(和/英) 河村 聡典 / Akinori KAWAMURA
第 4 著者 所属(和/英) 東芝研究開発センター
Corporate Research & Development Center, Toshiba Corporation
発表年月日 2004/12/14
資料番号 NLC2004-73,SP2004-113
巻番号(vol) vol.104
号番号(no) 542
ページ範囲 pp.-
ページ数 6
発行日