講演名 2014-11-17
多チャンネル階乗隠れマルコフモデルによる音響情景分析のための統合的アプローチ(情報論的学習理論ワークショップ(IBIS2014))
樋口 卓哉, 亀岡 弘和,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,音源分離・音響イベント検出・残響除去・音源の到来方向推定という,音響情景分析に関する諸問題を取り扱う.これら音響情景分析に関する問題の根幹にあるのは,ブラインド音源分離の問題である.ブラインド音源分離の問題は不良設定問題であり,一般に音源に関して何らかの仮定を置かない限り,解を限定し解くことができない.本稿では,音響情景分析に関する諸問題が相互依存の関係にあることに着目し,音響情景に関する様々なパラメータによって観測信号を確率的にモデル化することで,ブラインド音源分離の問題における解を限定すると共に,パラメータ推論を通して統合的に音響情景分析を行う手法を提案する.
抄録(英) This paper deals with the problems of audio source separation, audio event detection, dereverberation and DOA estimation. We focus on the fact that these problems are interdependent, and propose an unified approach for these problem. We model the generative process of observed signals with parameters each of which corresponds to a specific aspect of an audio source. Through the parameter inference, We can simultaneously salve the problems of auditory scene analysis.
キーワード(和) 非負値行列因子分解 / ブラインド音源分離 / 残響除去 / 音響イベント検出 / DOA
キーワード(英) Non-negative matrix factorization / blind source separation / dereverberation / audio event detection / DOA
資料番号 IBISML2014-57
発行日

研究会情報
研究会 IBISML
開催期間 2014/11/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Information-Based Induction Sciences and Machine Learning (IBISML)
本文の言語 JPN
タイトル(和) 多チャンネル階乗隠れマルコフモデルによる音響情景分析のための統合的アプローチ(情報論的学習理論ワークショップ(IBIS2014))
サブタイトル(和)
タイトル(英) Unified approach for auditory scene analysis based on multichannel factorial hidden Markov model
サブタイトル(和)
キーワード(1)(和/英) 非負値行列因子分解 / Non-negative matrix factorization
キーワード(2)(和/英) ブラインド音源分離 / blind source separation
キーワード(3)(和/英) 残響除去 / dereverberation
キーワード(4)(和/英) 音響イベント検出 / audio event detection
キーワード(5)(和/英) DOA / DOA
第 1 著者 氏名(和/英) 樋口 卓哉 / Takuya HIGUCHI
第 1 著者 所属(和/英) 東京大学大学院情報理工学系研究科
Graduate School of Information Science and Technology, The University of Tokyo
第 2 著者 氏名(和/英) 亀岡 弘和 / Hirokazu KAMEOKA
第 2 著者 所属(和/英) 東京大学大学院情報理工学系研究科:日本電信電話株式会社NTTコミュニケーション科学基礎研究所
Graduate School of Information Science and Technology, The University of Tokyo:NTT Communication Science Laboratories, Nippon Telegraph and Telephone Corporation
発表年月日 2014-11-17
資料番号 IBISML2014-57
巻番号(vol) vol.114
号番号(no) 306
ページ範囲 pp.-
ページ数 8
発行日