講演抄録/キーワード |
講演名 |
2014-10-23 15:10
無拘束での非言語特徴量推定に向けた長期連続話者自動推定システム ○中山雅野・村田裕章・横山ひとみ・堀田政二・藤田欣也(東京農工大) HCS2014-64 |
抄録 |
(和) |
本稿では無拘束環境下における話者推定手法について提案する.本手法は著者らが構築中の在室者観測システムの一部であり,コミュニケーション分析に向けた非言語特徴量推定のためのものである.本手法ではカメラ画像から検出した在室者位置と複数の超指向性マイクモジュールで得られた音源位置をポテンシャルとして統合することで外乱に対して比較的ロバストな話者推定を実現している.また推定結果に対し,ノイズ除去およびポーズの補間処理を行うことで,ベストケースでは適合率にして0.91,再現率にして0.86の精度を達成した. |
(英) |
We are developing group observation system under the unconstrained environments. In this paper, we proposed a method of speaker estimation, which is a part of the system. The proposed method includes human detection, sound position detection, noise removal and speaking pause interpolation. The result of human detection and sound position are combined as potential data to detect speakers. Comparing results of estimation to that of cording, the accuracy achieves 0.91 by precision and 0.86 by recall in the best case. |
キーワード |
(和) |
話者推定 / 無拘束環境 / 長期連続自動推定 / / / / / |
(英) |
Speaker Estimation / Unconstrained Environments / Long-term Continuous Automatic Estimation System / / / / / |
文献情報 |
信学技報, vol. 114, no. 273, HCS2014-64, pp. 25-30, 2014年10月. |
資料番号 |
HCS2014-64 |
発行日 |
2014-10-16 (HCS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
HCS2014-64 |