講演抄録/キーワード |
講演名 |
2013-02-01 09:50
実時間音源位置推定のための受音信号間位相差の変化量に基づく周波数帯域別最適空間分解能の検討 ○林田亘平・中山雅人・西浦敬信・山下洋一(立命館大) SIP2012-100 RCS2012-257 |
抄録 |
(和) |
本研究ではマイクロホンアレーを用いて対話型ロボットなどに向かって発話された音声を高品質に収録するために,音源の位置を実時間で推定する方法について検討する.
従来の音源位置推定法は離散化した空間の各点において周波数毎に処理を行うため,計算量が大きく実時間処理が困難という問題がある.
この問題を解決するため本研究では,音源位置の変化に伴うマイクロホン間の位相差の変化が,周波数の低域ほど小さく高域ほど大きいことに着目し,周波数に応じて異なる空間分解能を用いて音源位置を推定する周波数領域多重解像度走査を提案する.
提案法は空間スペクトルのピーク幅に基づいて周波数毎の方向と距離の空間分解能を決定し,周波数に応じて異なる空間分解能を組み合わせて用いることで位置推定性能を低下させること無く計算時間を低減する.
拡散性雑音の存在する実環境における評価実験の結果,提案法は従来と同等の位置推定性能を維持したまま,計算時間を低減可能であることを確認した. |
(英) |
Conventional near-field sound source localization methods with microphone-array calculate spatial spectrum in each scanning position of discretized space and each frequency.
Hence, elapsed time is increased and real-time processing is difficult.
Real-time processing is important for achieving the natural interaction with the speech interfaces.
To overcome this problem, we newly propose a sound source localization method based on Multi-resolution Scanning in Frequency Domain (MSFD).
MSFD utilizes lower spatial resolution in the lower frequency band and higher spatial resolution in the higher frequency band to reduce elapsed time.
The spatial resolution at each frequency is calculated on the basis of the variances of phase differences among microphones.
The results of evaluation experiment indicated that the proposed MSFD could reduce the elapsed time without degrading the localization accuracy. |
キーワード |
(和) |
マイクロホンアレー / 音源位置推定 / 実時間処理 / 多重解像度 / 空間分解能 / / / |
(英) |
Microphone-array / Sound source localization / Real-time processing / Multi-resolution scanning / Spatial resolution / / / |
文献情報 |
信学技報, vol. 112, no. 423, SIP2012-100, pp. 115-120, 2013年1月. |
資料番号 |
SIP2012-100 |
発行日 |
2013-01-24 (SIP, RCS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SIP2012-100 RCS2012-257 |