講演名 2012-02-10
ユーザ動作を許容する非可聴つぶやき認識のためのブラインド雑音抑圧法の改良(音声処理,時系列パターン認識)
石井 隼太, 戸田 智基, 猿渡 洋, サクティ サクリアニ, 中村 哲,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 静粛な環境など発話行為が躊躇される状況においても,音声入力アプリケーションの使用を可能とする技術として,非可聴つぶやき(Non-Audible Murmur: NAM)を用いた音声認識が提案されている.NAMは他人に聴受されないほどの小さな無声音声であり,体表に直接圧着させるNAMマイクロフォンによって収録される.そのため,ユーザの動作によっては,NAMマイクロフォンの圧着環境が大きく変動し,収録信号に非定常な雑音が混入する.これにより,NAM認識性能は著しく低下する.この雑音を抑圧するために2つのNAMマイクロフォンを用いてステレオNAM信号を収録し,ブラインドマルチチャンネル信号処理により認識性能の低下を抑止する手法が提案されている.本報告では,NAM信号を強調するためのブラインドチャンネル統合処理を新たに導入することで,さらなる雑音抑圧性能の向上を達成する.提案法では,ステレオNAM信号のチャンネル間の音響特性差を補正する統合フィルタを,自動的に求めることができる.大語彙連続音声認識実験による評価結果から,提案法の有効性を示す.
抄録(英) Recently, speech recognition with Non-Audible Murmur (NAM) was proposed in order to use speech interfaces in quiet environment where we hesitate to speech. NAM is a very soft whispered voice detected with NAM microphone, which is one of the body-conductive microphones. The detected NAM signal suffers from noise caused by speaker's movement because it changes the setting condition of NAM microphone. In order to suppress the noise, the blind noise suppression method using a stereo NAM signal detected with two NAM microphones was proposed. In this paper, we achieve further improvements in noise suppression performance by introducing a new blind channel integration process to emphasize the NAM signal. The proposed method is capable of automatically designing the enhancement filter to integrate the stereo signal by compensating for differences of acoustic characteristics between the two channels. The effectiveness of the proposed method is demonstrated from the results of experimental evaluations in a large vocabulary continuous speech recognition.
キーワード(和) 非可聴つぶやき認識 / ステレオ信号処理 / ブラインド空間的サブトラクションアレー / 非定常雑音 / チャンネル統合処理
キーワード(英) Non-Audoble Murmur recognition / Stereo signal processing / Blind spatial subtraction array / Non stationary noise / channel integration
資料番号 PRMU2011-233,SP2011-148
発行日

研究会情報
研究会 PRMU
開催期間 2012/2/2(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) ユーザ動作を許容する非可聴つぶやき認識のためのブラインド雑音抑圧法の改良(音声処理,時系列パターン認識)
サブタイトル(和)
タイトル(英) Improvements of blind noise suppression method for Non-Audible Murmur recognition tolerating user movement
サブタイトル(和)
キーワード(1)(和/英) 非可聴つぶやき認識 / Non-Audoble Murmur recognition
キーワード(2)(和/英) ステレオ信号処理 / Stereo signal processing
キーワード(3)(和/英) ブラインド空間的サブトラクションアレー / Blind spatial subtraction array
キーワード(4)(和/英) 非定常雑音 / Non stationary noise
キーワード(5)(和/英) チャンネル統合処理 / channel integration
第 1 著者 氏名(和/英) 石井 隼太 / Shunta ISHII
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 戸田 智基 / Tomoki TODA
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
第 3 著者 氏名(和/英) 猿渡 洋 / Hiroshi SARUWATARI
第 3 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
第 4 著者 氏名(和/英) サクティ サクリアニ / Sakriani SAKTI
第 4 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
第 5 著者 氏名(和/英) 中村 哲 / Satoshi NAKAMURA
第 5 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
発表年月日 2012-02-10
資料番号 PRMU2011-233,SP2011-148
巻番号(vol) vol.111
号番号(no) 430
ページ範囲 pp.-
ページ数 6
発行日