講演名 2011-03-10
学習による映像中の一般音源同定(一般セッション,文字・文書の認識と理解)
池田 千廣, フォン ヤオカイ, 内田 誠一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿は,映像中の一般音源同定を目的としている.一般音源同定とは,音源となり得る物体が複数カテゴリ想定される場合の音源同定問題を示す.本稿では,一般音源同定問題をAdaBoostを用いた識別器学習の枠組みで扱う.音源となり得る物体が複数カテゴリ存在するため,学習には,音特徴に加え,一般物体認識に有効とされる複数の画像特徴を用いる.まず,その画像特徴と音特徴を独立に扱いながら,識別器学習を試みる.その場合,音源同定問題独特の性質として,画像特徴と音特徴が与えられても音特徴がほとんど識別に寄与しないことが確認される.次にその解決法として,画像-音の相関特徴を識別器の学習に追加する.これにより,原理的に,音特徴が初めて有効に活用される.この事実を認識実験を行い,吟味した.
抄録(英) The purpose of this paper is to consider a sound source detection method.
キーワード(和) 音源同定 / 学習 / AdaBoost / Bag of Features / ST-patch
キーワード(英) sound source detection
資料番号 PRMU2010-248
発行日

研究会情報
研究会 PRMU
開催期間 2011/3/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 学習による映像中の一般音源同定(一般セッション,文字・文書の認識と理解)
サブタイトル(和)
タイトル(英) Sound Source Detection
サブタイトル(和)
キーワード(1)(和/英) 音源同定 / sound source detection
キーワード(2)(和/英) 学習
キーワード(3)(和/英) AdaBoost
キーワード(4)(和/英) Bag of Features
キーワード(5)(和/英) ST-patch
第 1 著者 氏名(和/英) 池田 千廣 / Chihiro IKEDA
第 1 著者 所属(和/英) 九州大学大学院システム情報科学府
Graduate School of Information Science and Electrical Engineering, Kyushu University
第 2 著者 氏名(和/英) フォン ヤオカイ / Yaokai FENG
第 2 著者 所属(和/英) 九州大学大学院システム情報研究院
Faculity of Information Science and Electrical Engineering, Kyushu University
第 3 著者 氏名(和/英) 内田 誠一 / Seiichi UCHIDA
第 3 著者 所属(和/英) 九州大学大学院システム情報研究院
Faculity of Information Science and Electrical Engineering, Kyushu University
発表年月日 2011-03-10
資料番号 PRMU2010-248
巻番号(vol) vol.110
号番号(no) 467
ページ範囲 pp.-
ページ数 6
発行日