講演名 2002/9/17
複数マイクロホンを用いた簡易な呼びかけ音方向同定システム
田嶋 誠, 鈴木 基之, 伊藤 彰則, 牧野 正三,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 自律移動ロボットのための呼びかけ音方向同定システムを作成した.我々が検討しているロボットは,ユーザの呼びかけによって起動し,画像処理によって顔認識を行い,呼びかけをした人を同定するが,画像処理を行うにはカメラの視野角に呼びかけをした人が入るようにしなければならない.そのために,本研究では呼びかけ音を認識し,到来方向を45度の範囲に絞り込む事を目的とする.また,ロボット搭載ということを考慮すると,ハードウェアの制約の中で少ない計算資源によって実時間処理を実現しなければならない.本研究では,少ない計算資源での実時間処理を前提として,複数の指向性マイクロホンを用いた簡易的な呼びかけ音の方向同定システムを構築した.また,システムの評価は複数のしきい値での再現率と適合率により行い,話者,キーワードのモーラ長,SN比という条件から,最も評価に影響するものがモーラ長であるという事を示した.さらに,モーラ長ごとに分析した結果,モーラ長ごとの適切なしきい値の設定がシステムの精度を向上させる可能性があることを確認した.最終的に,さまざまな話者・SN比のデータに対して,再現率・適合率共に80%以上という結果が得られた.
抄録(英) This paper describes a system to identify the direction of user's keyword utterance for autonomous mobile robot. The robot is activated by the user's keyword utterance and identifies the speaker by face recognition. To capture the speaker's face within the camera's viewangle, the robot first have to identify the approximate direction of the utterance using acoustic information. To achieve the above-mentioned task, this system identifies the direction of keyword utterance by multiple microphone within the range of 45 degree. As this system is built into the mobile robot, hardware requirement is very tight due to battery restriction and space factor restriction. Therefore we developed the system which doesn't need expensive calculation The system was evaluated by recall and precision using several thresholds. From the experimental results it is found that the length of the keyword dominates the absolute threshold value. Using mora-by-mora threshold, more than 80% recall and precision was obtained.
キーワード(和) 呼びかけ音の認識 / 方向同定 / 実時間処理 / ロボット / DPマッチング
キーワード(英) keyword spotting / utterance direction identification / real time processing / mobile robot / DP matching
資料番号 DSP2002-107
発行日

研究会情報
研究会 DSP
開催期間 2002/9/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Digital Signal Processing (DSP)
本文の言語 JPN
タイトル(和) 複数マイクロホンを用いた簡易な呼びかけ音方向同定システム
サブタイトル(和)
タイトル(英) The utterance direction identification system using multiple microphones
サブタイトル(和)
キーワード(1)(和/英) 呼びかけ音の認識 / keyword spotting
キーワード(2)(和/英) 方向同定 / utterance direction identification
キーワード(3)(和/英) 実時間処理 / real time processing
キーワード(4)(和/英) ロボット / mobile robot
キーワード(5)(和/英) DPマッチング / DP matching
第 1 著者 氏名(和/英) 田嶋 誠 / Makoto TAJIMA
第 1 著者 所属(和/英) 東北大学 大学院情報科学研究科
Graduate School of Information Sciences, Tohoku University
第 2 著者 氏名(和/英) 鈴木 基之 / Motoyuki SUZUKI
第 2 著者 所属(和/英) 東北大学 大学院情報科学研究科
Graduate School of Information Sciences, Tohoku University
第 3 著者 氏名(和/英) 伊藤 彰則 / Akinori ITO
第 3 著者 所属(和/英) 東北大学 大学院工学研究
Graduate School of Engineering, Tohoku University
第 4 著者 氏名(和/英) 牧野 正三 / Shozo MAKINO
第 4 著者 所属(和/英) 東北大学 大学院工学研究
Graduate School of Engineering, Tohoku University
発表年月日 2002/9/17
資料番号 DSP2002-107
巻番号(vol) vol.102
号番号(no) 333
ページ範囲 pp.-
ページ数 6
発行日