講演抄録/キーワード |
講演名 |
2009-01-23 13:20
音声情報と画像情報を融合したダブルトーク検出 ○村田直也・梶川嘉延(関西大) SIP2008-160 RCS2008-208 |
抄録 |
(和) |
テレビ会議システム等の拡声通話系で発生する音響エコーを除去する音響エコーキャンセラ(AEC:Acoustic Echo Canceller) の一つにサブ適応フィルタ(Sub-ADF:Sub Adaptive Filter) を用いた手法が提案されている.ここで用いられるダブルトーク検出器において,音声情報に加え画像情報も用いるマルチモーダル処理を行うことで,ダブルトーク検出の性能向上を図る.本稿では画像処理により得られる口唇画像を2 値化処理し,得た画像特徴量を用い発話区間を検出する.これと音声情報を併用し,従来法の性能を上回るダブルトーク検出を実現する. |
(英) |
An acoustic echo canceller (AEC) using Sub-Adaptive-Filter (Sub-ADF) has been already proposed to remove an acoustic echo in teleconference system.In order to improve the performance of the double-talk detector in this method, we propose a double-talk detector using multi-modal information which consists of sound and image information. The proposed method detects a voice activity from image information which is obtained from binarized lip image and can consequently improve the performance of the double-talk detection. |
キーワード |
(和) |
音響エコーキャンセラ / 適応アルゴリズム / ダブルトーク検出 / マルチモーダル / / / / |
(英) |
Acoustic Echo Canceller / Adaptive Algorithm / Double Talk Detection / Multi Modal / / / / |
文献情報 |
信学技報, vol. 108, no. 390, SIP2008-160, pp. 213-218, 2009年1月. |
資料番号 |
SIP2008-160 |
発行日 |
2009-01-15 (SIP, RCS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SIP2008-160 RCS2008-208 |