講演名 2005/12/14
実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
佐藤 庄衛, 尾上 和穂, 本間 真一, 小林 彰夫, 今井 亨,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では, 放送音声の認識率の低下の要因の一つである発話スタイルの影響を改善するため, 学習音声中の発声変形頻度を基準とする発声変形用音響モデルの導入法を検討した.発声変形を取り扱う単位として, トライフォン単位と単語単位, およびこれらの単位間でHMMを共有する場合と独立したHMMを用いる場合を取り上げ, 次の二つのタスクにおいて, 誤認識単語の削減効果を比較した.第一のタスクは, メタデータ制作を目的としたJリーグ中継の実況音声の認識であり, 絶叫発話と話速の速い部分を対象とし, 発声変形の単位を単語としてHMMを共有した場合に, キーワード誤りの15%が削減された.第二のタスクはニュース番組中の対談部分の認識であり, 話速の速い部分に起こる発声変形を対象とした.認識実験の結果, 発声変形の単位を単語とし, HMMを共有しない場合が, 認識率と探索空間の面から有利であることが確認された.一方, 発声変形とみなす単位を単語とした場合の実験結果から, 発声変形に単語依存性があることが確認され, HMMを共有した場合に認識誤りの10%が削減された.
抄録(英) This paper investigates acoustic models for utterance variation and their units to improve recognition performance. Using a phoneme or a word as a unit of the variation, the models for utterance variation were trained for frequently observable variation. The variation models sharing HMMs among these models were also examined. The models trained for excitedly uttered words reduced 15% of key word erorrs in sports commentary. The models trained for rapidly pronounced reduced words 10% of word errors in conversational news. The results also showed dependence of the variation upon words.
キーワード(和) 音声認識 / 音響モデル / 対談 / 発声変形 / 話速
キーワード(英) Speech recognition / Acoustic model / Conversation / Utterance variation / Speech rate
資料番号 NLC2005-62,SP2005-95
発行日

研究会情報
研究会 NLC
開催期間 2005/12/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Acoustic models for utterance variation in broadcast commentary and conversation
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / Speech recognition
キーワード(2)(和/英) 音響モデル / Acoustic model
キーワード(3)(和/英) 対談 / Conversation
キーワード(4)(和/英) 発声変形 / Utterance variation
キーワード(5)(和/英) 話速 / Speech rate
第 1 著者 氏名(和/英) 佐藤 庄衛 / Shoei SATO
第 1 著者 所属(和/英) NHK放送技術研究所
NHK Science and Techinical Research Laboratories
第 2 著者 氏名(和/英) 尾上 和穂 / Kazuo ONOE
第 2 著者 所属(和/英) NHK放送技術研究所
NHK Science and Techinical Research Laboratories
第 3 著者 氏名(和/英) 本間 真一 / Shinich HOMMA
第 3 著者 所属(和/英) NHK放送技術研究所
NHK Science and Techinical Research Laboratories
第 4 著者 氏名(和/英) 小林 彰夫 / Akio KOBAYASHI
第 4 著者 所属(和/英) NHK放送技術研究所
NHK Science and Techinical Research Laboratories
第 5 著者 氏名(和/英) 今井 亨 / Toru IMAI
第 5 著者 所属(和/英) NHK放送技術研究所
NHK Science and Techinical Research Laboratories
発表年月日 2005/12/14
資料番号 NLC2005-62,SP2005-95
巻番号(vol) vol.105
号番号(no) 493
ページ範囲 pp.-
ページ数 6
発行日