講演名 2014-06-16
HARKによって定位・分離された多方向音声のアノテーションツールの開発(エージェントを用いた実世界インタラクション,及び一般)
杉山 治, 糸山 克寿, 中臺 一博, 奥乃 博,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では、ロボット聴覚ソフトウェアHARKに基づいた多方向音声のアノテーションツールの開発について述べる。多方向の音声情報を視覚化し分かりやすく提示する既存研究は存在するが、提示された情報をラベル付けし、セマンティックにアノテーションするまでを一括して行うツールはまだ提案されていない。本研究では、HARKによって音源定位・分離された多方向音声をアノテーションするツールを開発し、アノテーションの負荷を軽減するためにSVMに基づく、自動補完機能を実装した。そして、被験者実験を通じて、その有効性を検証した。
抄録(英) In this study we designed and developed the multidirectional sound source annotation tool with the robot audition software, HARK. With the rise of inexpensive microphone array products and the robot audition software called HARK, we can record and analyze multidirectional sound sources easily. The combination of microphone array and the software enables us to separate, localize, and track multidirectional sound sources. Most of the solutions for accessing these separated sound source information provide clients for interpreting simplified information about the separated sources, but not to directly execute the semantic annotations. Our proposed sound annotation tool provides drag & drop operation of annotation with a 3D sound source view and also provides annotation autocompletion with a SVM trained with the user ' s annotation history. The proposed features enable users to do the annotation task intuitively and confirm its result. We also conducted an evaluation demonstrating the efficiency of annotation done using the tool.
キーワード(和) ユーザインタフェース / 音源分離・定位 / アノテーション / 自動補完 / HARK
キーワード(英) User interface / sound source separation / sound source localization / annotation / autocompletion / HARK
資料番号 CNR2014-5
発行日

研究会情報
研究会 CNR
開催期間 2014/6/9(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Cloud Network Robotics (CNR)
本文の言語 JPN
タイトル(和) HARKによって定位・分離された多方向音声のアノテーションツールの開発(エージェントを用いた実世界インタラクション,及び一般)
サブタイトル(和)
タイトル(英) Design and Implementation of Multidirectional Sound Annotation Tool with HARK
サブタイトル(和)
キーワード(1)(和/英) ユーザインタフェース / User interface
キーワード(2)(和/英) 音源分離・定位 / sound source separation
キーワード(3)(和/英) アノテーション / sound source localization
キーワード(4)(和/英) 自動補完 / annotation
キーワード(5)(和/英) HARK / autocompletion
第 1 著者 氏名(和/英) 杉山 治 / Osamu SUGIYAMA
第 1 著者 所属(和/英) 東京工業大学情報理工学研究科
Graduate School of Information Science and Engineering, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 糸山 克寿 / Katsutoshi ITOYAMA
第 2 著者 所属(和/英) 京都大学情報学研究科
Graduate School of Informatics, Kyoto University
第 3 著者 氏名(和/英) 中臺 一博 / Kazuhiro NAKADAI
第 3 著者 所属(和/英) 東京工業大学情報理工学研究科:ホンダ・リサーチ・インスティチュート・ジャパン
Graduate School of Information Science and Engineering, Tokyo Institute of Technology:Honda Research Institute Japan
第 4 著者 氏名(和/英) 奥乃 博 / Hiroshi G. OKUNO
第 4 著者 所属(和/英) 早稲田大学実体情報学博士プログラム
Graduate Program for Embodiment Informatics, Waseda University
発表年月日 2014-06-16
資料番号 CNR2014-5
巻番号(vol) vol.114
号番号(no) 85
ページ範囲 pp.-
ページ数 4
発行日