講演名 2012/6/22
ノンパラメトリックベイズアプローチに基づく音響イベント検出(テーマセッション,自然言語とパターン認識の境界)
大石 康智, 持橋 大地, 松井 知子, 中野 允裕, 亀岡 弘和, 泉谷 知範, 柏野 邦夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 膨大な音や映像のメディアデータを自在に検索して活用するためには,付随するテキストデータに頼るだけではなく,それぞれの中身を表す情報を,音や映像自体から自動的に引き出す技術が必要不可欠である.本稿では,ノンパラメトリックベイズ手法を用いて,複数の音響イベントが重なり合った音響信号から,音響イベントの種類や数,各イベントの発音区間をすべて,教師なしで学習する手法を提案し,その評価実験結果を述べる.
抄録(英) As the amount of available multimedia data increases, the technique to automatically extract the significant information from audio or video files is crucial to application in multimedia search. In this paper, we propose a Bayesian unsupervised method for temporally locating overlapping audio events and learning the number of the events and the acoustic characteristics in an audio mixture signal. Experimental results show that our method characterizes the audio events effectively.
キーワード(和) 音響イベント検出 / 非負値行列因子分解 / ノンパラメトリックベイズ / スライスサンプリング
キーワード(英) Audio event detection / Nonnegative matrix factorization / Nonparametric Bayes / Slice sampling
資料番号 PRMU2012-29,NLC2012-9
発行日

研究会情報
研究会 PRMU
開催期間 2012/6/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) ノンパラメトリックベイズアプローチに基づく音響イベント検出(テーマセッション,自然言語とパターン認識の境界)
サブタイトル(和)
タイトル(英) Bayesian Nonparametric Approach to Audio Event Detection
サブタイトル(和)
キーワード(1)(和/英) 音響イベント検出 / Audio event detection
キーワード(2)(和/英) 非負値行列因子分解 / Nonnegative matrix factorization
キーワード(3)(和/英) ノンパラメトリックベイズ / Nonparametric Bayes
キーワード(4)(和/英) スライスサンプリング / Slice sampling
第 1 著者 氏名(和/英) 大石 康智 / Yasunori OHISHI
第 1 著者 所属(和/英) 日本電信電話株式会社コミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 2 著者 氏名(和/英) 持橋 大地 / Daichi MOCHIHASHI
第 2 著者 所属(和/英) 大学共同利用機関法人情報・システム研究機構統計数理研究所
The Institute of Statistical Mathematics
第 3 著者 氏名(和/英) 松井 知子 / Tomoko MATSUI
第 3 著者 所属(和/英) 大学共同利用機関法人情報・システム研究機構統計数理研究所
The Institute of Statistical Mathematics
第 4 著者 氏名(和/英) 中野 允裕 / Masahiro NAKANO
第 4 著者 所属(和/英) 日本電信電話株式会社コミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 5 著者 氏名(和/英) 亀岡 弘和 / Hirokazu KAMEOKA
第 5 著者 所属(和/英) 日本電信電話株式会社コミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 6 著者 氏名(和/英) 泉谷 知範 / Tomonori IZUMITANI
第 6 著者 所属(和/英) 日本電信電話株式会社コミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 7 著者 氏名(和/英) 柏野 邦夫 / Kunio KASHINO
第 7 著者 所属(和/英) 日本電信電話株式会社コミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
発表年月日 2012/6/22
資料番号 PRMU2012-29,NLC2012-9
巻番号(vol) vol.112
号番号(no) 111
ページ範囲 pp.-
ページ数 6
発行日