講演名 2006/12/15
講義音声認識における収録装置とケプストラム正規化法の検討(Session-6 音声認識,第8回音声言語シンポジウム)
富樫 慎吾, 北岡 教英, 中川 聖一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,講義情報をセマンティツクコンテンツ化するための要素技術である音声認識による自動書き起こしの精度向上に関する検討を行った.まず,複数のマイク・音響モデル・デコーダを種々組み合わせて認識実験を行い,環境によって認識精度にどの程度影響があるのかを調べた.この結果,マイクの違いが認識精度に与える影響が非常に大きく,ハンドマイクで収録した音声と,ワイヤレスピンマイクを用いて圧縮処理を行った音声では,認識精度に最大で約23%の差があらわれることがわかった.しかし,収録時の利便性を考えると,実用上はワイヤレスピンマイクの方が望ましい.そこで,こうした粗雑な収録環境で得られた音声からも高精度に音声認識を行うために,ケプストラムの正規化手法として平均正規化(CMN)、分散正規化(CVN),そしてケプストラムの分布を一致させるヒストグラム正規化(HEQ)を実験し,またその実行単位についても検討を行った.
抄録(英) In this paper, we described the investigation of methods to improve the performance of ASR used for extending lecture information into semantic contents. First, we investigate the effects of difference among microphones, acoustic models and decorders. It turned out that using pin-microphone decrease up to 23% compared to handheld-microphone in accuracy. There is significant impact by the difference between handheld-microphone and pin-microphone to performance. To improve the performance even when using a cheap equipment like this, we tried to apply some cepstrum normalization methods, like CMN, CVN and HEQ to lecture speech data, in which we considered about unit of the normalization process.
キーワード(和) 講義音声 / 音声認識 / ケプストラム正規化 / ヒストグラム正規化
キーワード(英) Lecture Speech / Automatic Speech Recognition / Cepstrum Normalization / Histogram Normalization
資料番号 NLC2006-65,SP2006-121
発行日

研究会情報
研究会 SP
開催期間 2006/12/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 講義音声認識における収録装置とケプストラム正規化法の検討(Session-6 音声認識,第8回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) An Investigation of Variation of Recording Systems and Cepstrum Normalization for Recognition of Lecture Speech
サブタイトル(和)
キーワード(1)(和/英) 講義音声 / Lecture Speech
キーワード(2)(和/英) 音声認識 / Automatic Speech Recognition
キーワード(3)(和/英) ケプストラム正規化 / Cepstrum Normalization
キーワード(4)(和/英) ヒストグラム正規化 / Histogram Normalization
第 1 著者 氏名(和/英) 富樫 慎吾 / Shingo TOGASHI
第 1 著者 所属(和/英) 豊橋技術科学大学 情報工学系
Toyohashi University of Technology
第 2 著者 氏名(和/英) 北岡 教英 / Norihide KITAOKA
第 2 著者 所属(和/英) 名古屋大学大学院 情報科学研究科
Nagoya University
第 3 著者 氏名(和/英) 中川 聖一 / Seiichi NAKAGAWA
第 3 著者 所属(和/英) 豊橋技術科学大学 情報工学系
Toyohashi University of Technology
発表年月日 2006/12/15
資料番号 NLC2006-65,SP2006-121
巻番号(vol) vol.106
号番号(no) 444
ページ範囲 pp.-
ページ数 6
発行日