講演名 2007/11/21
AMとFMの長時間分析に基づく音声認識
久保 陽太郎, 大川 茂樹, 榑松 明, 白井 克彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声認識システムを実用化するにあたり,未知の環境での精度向上が重要な課題となっている.現実的な環境ノイズは音声信号の限られた特性にしか作用しないため,それぞれ異なる特性に依存する識別器を組み合わせることで未知の環境へのロバストネスを高めることができる.また他方では,長時間の分析によって得られる特徴量が環境の変化に対して頑健であることが報告されている.これらを踏まえ本稿では,さらに高精度かつロバストな音声認識器の実現を目指し,二種類の長時間特徴量識別器を適応的に組み合わせる音声認識方法を提案し、実装した.一つめの長時間特徴量は,従来よりその重要性が指摘されている狭帯域音声のAM変調から導出したものである.もうひとつの長時間特徴量は,AM-FMモデルにおけるもう一つの変調である狭帯域音声のFM変調から導出したものである.本稿では,これら二つの分析器の分析結果を条件付きエントロピーによって重み付けし統合することで,環境に対しロバストな音声認識器を構築した.提案手法を実環境雑音下における連続数字認識タスクで評価し,有効性を示した.
抄録(英) In this paper, we introduce novel speech recognition system based on adaptive combination two types of temporal features. In order to utilize an ASR systems in realistic environments, robustness to environmental effect is important. Because most of environmental effects damage limited property of speech signal, combining multiple classifier is efficient for acquiring robustness. On the otherhand, many studies show the robustness of temporal features such as RASTA and TRAPS. Proposed method combining two temporal feature classifiers adaptively. One of the classifiers uses amplitude modulation of speech signal which have been investigated by several studies. The other classifier uses frequency modulation of speech signal. The combination of two classifiers are performed by weigted sum of logarithmic posterior probability. We evaluated proposed method by conducting continuous digit recognition task of speech polluted by realistic noise.
キーワード(和) 音声認識 / 長時間特徴量 / Tandem-アプローチ / AM-FMモデル
キーワード(英) Speech recognition / temporal feature / tandem-approach / AM-FM modeling
資料番号 SP2007-91
発行日

研究会情報
研究会 SP
開催期間 2007/11/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) AMとFMの長時間分析に基づく音声認識
サブタイトル(和)
タイトル(英) A Study on Speech Recognizer based on Temporal AM-FM Analysis
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / Speech recognition
キーワード(2)(和/英) 長時間特徴量 / temporal feature
キーワード(3)(和/英) Tandem-アプローチ / tandem-approach
キーワード(4)(和/英) AM-FMモデル / AM-FM modeling
第 1 著者 氏名(和/英) 久保 陽太郎 / Yotaro KUBO
第 1 著者 所属(和/英) 早稲田大学理工学術院
Dept. of Computer Science and Engineering, Waseda University
第 2 著者 氏名(和/英) 大川 茂樹 / Shigeki OKAWA
第 2 著者 所属(和/英) 千葉工業大学
Chiba Institute of Technology
第 3 著者 氏名(和/英) 榑松 明 / Akira KUREMATSU
第 3 著者 所属(和/英) 早稲田大学理工学術院
Dept. of Computer Science and Engineering, Waseda University
第 4 著者 氏名(和/英) 白井 克彦 / Katsuhiko SHIRAI
第 4 著者 所属(和/英) 早稲田大学理工学術院
Dept. of Computer Science and Engineering, Waseda University
発表年月日 2007/11/21
資料番号 SP2007-91
巻番号(vol) vol.107
号番号(no) 356
ページ範囲 pp.-
ページ数 6
発行日