講演名 2008-12-09
ベイジアンネットワークを用いた単一チャネル信号による背景音楽抑圧(音響処理・話者同定,第10回音声言語シンポジウム)
伊藤 弘章, 西野 隆典, 北岡 教英, 武田 一哉,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では背景音楽混じり音声の背景音楽抑圧のための,単一チャネル信号によるノンパラメトリックな確率的手法を提案する.提案手法では,ベイズ識別器が混合信号の時間-周波数成分の局所依存性をモデル化するように拡張し,そのモデルに基づいたバイナリマスキングを行う.時間-周波数成分の依存性は,ベイズ識別器を拡張したグラフとして表現する.また提案手法は音源分離のためのベクトル量子化に基づく射影法の拡張であることも示す.最適な音響分析条件やグラフ構造は実験的に決定する.提案手法の有効性を確認するために,6種類の音声とポップ音楽を計算機上で加算した混合信号に対して背景音楽抑圧実験を行い,音質の改善率を評価した.実験結果より,従来法よりも改善率が4%上回った.
抄録(英) A non-parametric stochastic method of the single-channel speech extraction from a mixture of speech and music is proposed. In the proposed method, conventional binary masking based on Bayesian classifier is extended so that the local dependency among time-frequency components of the mixture signal is modeled. A graphical representation of the dependency is introduced as a natural extension of the Bayesian classifier. We show that the proposed approach also extends the VQ based projection method for signal separation. Training scenario and optimal graph topology of the proposed method is exploit through experimental discussions. Finally, the performance of the proposed method is evaluated using six mixtures of speech and pop music. Through the experiments, the effectiveness of the method is clarified by overperforming the conventional method by 4% relative improvement of sound quality.
キーワード(和) 単一チャネル音源分離 / 背景音楽抑圧 / バイナリマスキング / ベイジアンネットワーク
キーワード(英) single-channel sound source separation / background music suppression / binary masking / Bayesian networks
資料番号 NLC2008-27,SP2008-82
発行日

研究会情報
研究会 NLC
開催期間 2008/12/2(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) ベイジアンネットワークを用いた単一チャネル信号による背景音楽抑圧(音響処理・話者同定,第10回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Music suppression method for single channel speech mixed with BGM using Bayesian networks
サブタイトル(和)
キーワード(1)(和/英) 単一チャネル音源分離 / single-channel sound source separation
キーワード(2)(和/英) 背景音楽抑圧 / background music suppression
キーワード(3)(和/英) バイナリマスキング / binary masking
キーワード(4)(和/英) ベイジアンネットワーク / Bayesian networks
第 1 著者 氏名(和/英) 伊藤 弘章 / Hiroaki ITOU
第 1 著者 所属(和/英) 名古屋大学大学院情報科学研究科
Graduate School of Information Science, Nagoya University
第 2 著者 氏名(和/英) 西野 隆典 / Takanori NISHINO
第 2 著者 所属(和/英) 名古屋大学大学院情報科学研究科
Graduate School of Information Science, Nagoya University
第 3 著者 氏名(和/英) 北岡 教英 / Norihide KITAOKA
第 3 著者 所属(和/英) 名古屋大学大学院情報科学研究科
Graduate School of Information Science, Nagoya University
第 4 著者 氏名(和/英) 武田 一哉 / Kazuya TAKEDA
第 4 著者 所属(和/英) 名古屋大学大学院情報科学研究科
Graduate School of Information Science, Nagoya University
発表年月日 2008-12-09
資料番号 NLC2008-27,SP2008-82
巻番号(vol) vol.108
号番号(no) 337
ページ範囲 pp.-
ページ数 6
発行日