講演名 2004/12/14
帯域分割型CSP法に基づく話者位置推定法の検討(ポスターセッション)(第6回音声言語シンポジウム)
傳田 遊亀, 西浦 敬信, 河原 英紀, 入野 俊夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声制御システムやテレビ会議システムなどにおいて,発話者から離れた位置にあるマイクロホンで発話者の音声を高品質に受音することば極めて重要である.発話者から離れた位置のマイクロホンで発話者の音声を高音質に受音する方法として,マイクロホンアレーによる音声強調法が提案されている.しかし,マイクロホンアレーを用いて音声を強調するためには発話者の位置を推定することが必要となる.このため,例えばCSP(Cross-power Spectrum Phase)法に基づく発話者位置推定法が提案されている.しかし,CSP法には高雑音環境下で話者位置推定性能が低下してしまうという問題がある.そこで本稿では,音声の平均スペクトルで重み付けされた帯域分割型CSP法を提案し,音声に特化した位置推定法を提案する.また.提案手法によって発話者位置を推定した後,マイクロホンアレーによって目的音声を強調した場合の音声認識性能も合わせて評価する.実環境における評価実験の結果,提案手法は.従来法より高い話者位置推定性能を得られることを確認した.
抄録(英) It is very important to capture distant-talking speech with high quality for voice-controlled systems or teleconferencing systems. A microphone array steering is an idela candidate as an effective method for capturing distant talking speech with high quality. However, it requires to localize a target talker before capturing distant-talking speech. For this purpose, a talker localization method based on GSP (Cross-power Spectrum Phase) analysis has been proposed, for example. However, talker localization performance of the CSP analysis is degraded in higher noisy environments. To deal with this problem, in this papaer, we propose a subband CSP analysis with weighting of average speech spectrum and we propose a specialized localization method for speech. In addition, we evaluate the ASR (Automatic Speech Recognition) performance when the microphone array steering is steered to the estimated talker direction by the proposed method. As a result of evaluation experiments in a real room, we confirmed that the proposed method provides better talker localization performance than the conventional method.
キーワード(和) 発話者位置推定 / CSP法 / 帯域分割分析 / マイクロホンアレー / 音声認識
キーワード(英) Talker localization / CSP analysis / Subband analysis / Microphone array / Speech recognition
資料番号 NLC2004-69,SP2004-109
発行日

研究会情報
研究会 SP
開催期間 2004/12/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 帯域分割型CSP法に基づく話者位置推定法の検討(ポスターセッション)(第6回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) A Study of Talker Localization Based on Subband CSP Analysis
サブタイトル(和)
キーワード(1)(和/英) 発話者位置推定 / Talker localization
キーワード(2)(和/英) CSP法 / CSP analysis
キーワード(3)(和/英) 帯域分割分析 / Subband analysis
キーワード(4)(和/英) マイクロホンアレー / Microphone array
キーワード(5)(和/英) 音声認識 / Speech recognition
第 1 著者 氏名(和/英) 傳田 遊亀 / Yuki DENDA
第 1 著者 所属(和/英) 和歌山大学大学院システム工学研究科
Graduate School of Systems Engineering, Wakayama University
第 2 著者 氏名(和/英) 西浦 敬信 / Takanobu NISHIURA
第 2 著者 所属(和/英) 立命館大学情報理工学部
College of Information Science and Engineering, Ritsumeikan University
第 3 著者 氏名(和/英) 河原 英紀 / Hideki KAWAHARA
第 3 著者 所属(和/英) 和歌山大学大学院システム工学研究科
Graduate School of Systems Engineering, Wakayama University
第 4 著者 氏名(和/英) 入野 俊夫 / Toshio IRINO
第 4 著者 所属(和/英) 和歌山大学大学院システム工学研究科
Graduate School of Systems Engineering, Wakayama University
発表年月日 2004/12/14
資料番号 NLC2004-69,SP2004-109
巻番号(vol) vol.104
号番号(no) 542
ページ範囲 pp.-
ページ数 6
発行日