講演名 | 2011-03-10 学習による映像中の一般音源同定(一般セッション,文字・文書の認識と理解) 池田 千廣, フォン ヤオカイ, 内田 誠一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿は,映像中の一般音源同定を目的としている.一般音源同定とは,音源となり得る物体が複数カテゴリ想定される場合の音源同定問題を示す.本稿では,一般音源同定問題をAdaBoostを用いた識別器学習の枠組みで扱う.音源となり得る物体が複数カテゴリ存在するため,学習には,音特徴に加え,一般物体認識に有効とされる複数の画像特徴を用いる.まず,その画像特徴と音特徴を独立に扱いながら,識別器学習を試みる.その場合,音源同定問題独特の性質として,画像特徴と音特徴が与えられても音特徴がほとんど識別に寄与しないことが確認される.次にその解決法として,画像-音の相関特徴を識別器の学習に追加する.これにより,原理的に,音特徴が初めて有効に活用される.この事実を認識実験を行い,吟味した. |
抄録(英) | The purpose of this paper is to consider a sound source detection method. |
キーワード(和) | 音源同定 / 学習 / AdaBoost / Bag of Features / ST-patch |
キーワード(英) | sound source detection |
資料番号 | PRMU2010-248 |
発行日 |
研究会情報 | |
研究会 | PRMU |
---|---|
開催期間 | 2011/3/3(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Pattern Recognition and Media Understanding (PRMU) |
---|---|
本文の言語 | JPN |
タイトル(和) | 学習による映像中の一般音源同定(一般セッション,文字・文書の認識と理解) |
サブタイトル(和) | |
タイトル(英) | Sound Source Detection |
サブタイトル(和) | |
キーワード(1)(和/英) | 音源同定 / sound source detection |
キーワード(2)(和/英) | 学習 |
キーワード(3)(和/英) | AdaBoost |
キーワード(4)(和/英) | Bag of Features |
キーワード(5)(和/英) | ST-patch |
第 1 著者 氏名(和/英) | 池田 千廣 / Chihiro IKEDA |
第 1 著者 所属(和/英) | 九州大学大学院システム情報科学府 Graduate School of Information Science and Electrical Engineering, Kyushu University |
第 2 著者 氏名(和/英) | フォン ヤオカイ / Yaokai FENG |
第 2 著者 所属(和/英) | 九州大学大学院システム情報研究院 Faculity of Information Science and Electrical Engineering, Kyushu University |
第 3 著者 氏名(和/英) | 内田 誠一 / Seiichi UCHIDA |
第 3 著者 所属(和/英) | 九州大学大学院システム情報研究院 Faculity of Information Science and Electrical Engineering, Kyushu University |
発表年月日 | 2011-03-10 |
資料番号 | PRMU2010-248 |
巻番号(vol) | vol.110 |
号番号(no) | 467 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |