学習による映像中の一般音源同定(一般セッション,文字・文書の認識と理解)

講演名	2011-03-10 学習による映像中の一般音源同定(一般セッション,文字・文書の認識と理解) 池田千廣, フォンヤオカイ, 内田誠一,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本稿は,映像中の一般音源同定を目的としている.一般音源同定とは,音源となり得る物体が複数カテゴリ想定される場合の音源同定問題を示す.本稿では,一般音源同定問題をAdaBoostを用いた識別器学習の枠組みで扱う.音源となり得る物体が複数カテゴリ存在するため,学習には,音特徴に加え,一般物体認識に有効とされる複数の画像特徴を用いる.まず,その画像特徴と音特徴を独立に扱いながら,識別器学習を試みる.その場合,音源同定問題独特の性質として,画像特徴と音特徴が与えられても音特徴がほとんど識別に寄与しないことが確認される.次にその解決法として,画像-音の相関特徴を識別器の学習に追加する.これにより,原理的に,音特徴が初めて有効に活用される.この事実を認識実験を行い,吟味した.
抄録(英)	The purpose of this paper is to consider a sound source detection method.
キーワード(和)	音源同定 / 学習 / AdaBoost / Bag of Features / ST-patch
キーワード(英)	sound source detection
資料番号	PRMU2010-248
発行日

講演論文情報詳細
申込み研究会	Pattern Recognition and Media Understanding (PRMU)
本文の言語	JPN
タイトル（和）	学習による映像中の一般音源同定(一般セッション,文字・文書の認識と理解)
サブタイトル（和）
タイトル（英）	Sound Source Detection
サブタイトル（和）
キーワード(1)（和/英）	音源同定 / sound source detection
キーワード(2)（和/英）	学習
キーワード(3)（和/英）	AdaBoost
キーワード(4)（和/英）	Bag of Features
キーワード(5)（和/英）	ST-patch
第 1 著者氏名（和/英）	池田千廣 / Chihiro IKEDA
第 1 著者所属（和/英）	九州大学大学院システム情報科学府 Graduate School of Information Science and Electrical Engineering, Kyushu University
第 2 著者氏名（和/英）	フォンヤオカイ / Yaokai FENG
第 2 著者所属（和/英）	九州大学大学院システム情報研究院 Faculity of Information Science and Electrical Engineering, Kyushu University
第 3 著者氏名（和/英）	内田誠一 / Seiichi UCHIDA
第 3 著者所属（和/英）	九州大学大学院システム情報研究院 Faculity of Information Science and Electrical Engineering, Kyushu University
発表年月日	2011-03-10
資料番号	PRMU2010-248
巻番号（vol）	vol.110
号番号（no）	467
ページ範囲	pp.-
ページ数	6
発行日