話題依存言語モデル構築のためのLSAと単語発音情報を用いた語彙推定

藤原 裕幸; 西崎 博光; 関口 芳廣

大会名称
2009年情報科学技術フォーラム(FIT)
大会コ－ド
F
開催年
2009
発行日
2009/8/20
セッション番号
3F
セッション名
音声認識・話者認識
講演日
2009/09/02
講演場所(会議室等)
F会場（9号館2F　921教室）
講演番号
RE-004
タイトル
話題依存言語モデル構築のためのLSAと単語発音情報を用いた語彙推定
著者名
藤原裕幸, 西崎博光, 関口芳廣,
キーワード
音声認識, 言語モデル, 話題適応化, Webテキスト, 潜在的意味解析, 語彙推定
抄録
本研究では,話題依存言語モデルと音声認識辞書に登録する語彙の推定手法について述べる.言語モデル上で学習させる語彙数が多くなると,語彙のカバー率が上昇し未知語率が減少する.その結果音声認識率の改善が図れる.しかし,同じ未知語率であれば語彙のサイズが小さい方が認識率は良いはずである.そこで本研究では,モデル化すべき語彙を推定するために,言語モデル適応化用に集めたWebテキスト等に潜在的意味解析を適用する手法と単語の発音情報を利用する手法を提案する.実験の結果,提案手法により,わずかながら音声認識率を改善することができた.また,同時に認識処理や言語モデルのサイズを削減することができた.
本文pdf
PDF download (474.6KB)