講演名 | 2020-03-02 ブラインド音源分離のための高速多チャネル相関テンソル分解 吉井 和佳(京大/理研), 関口 航平(理研/京大), 坂東 宜昭(産総研), Mathieu Fontaine(理研), Aditya Arie Nugraha(理研), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿では,多チャネル複素スペクトログラム(時間・周波数・チャネルからなる三階複素テンソル)の全要素間の相関を取り扱うことができる,独立性・低ランク性・非負性(半正定性)に基づく究極のブラインド音源分離 (BSS) 手法について述べる.独立成分分析 (ICA) に端を発するBSS手法の多くは,独立な音源スペクトログラムを求めるうえで,周波数ごとの空間共分散行列(空間モデル)を主な手掛かりとしているため,周波数間で音源成分を関連付けるには,音源スペクトログラムの時間周波数構造(音源モデル)を利用する.代表的なものに,音源パワースペクトル密度の低ランク性を仮定し,非負値行列分解 (NMF) に基づく音源モデルを用いた多チャネルNMF (MNMF) が知られている.また,空間共分散行列を同時対角化可能なものに制限することで,分離性能を維持しつつ計算量を大幅に削減した高速MNMF (FastMNMF) が最近提案されている.しかし,位相情報を無視するNMFでは,時間周波数ビン間の共起関係しか取り扱えず,パーミュテーション解決への貢献は限定的であった.本研究では,NMFの究極的な拡張である相関テンソル分解 (CTF) を音源モデルに持ち,時間周波数ビン間とチャネル間の相関関係を同時に考慮できる多チャネルCTF (MCTF) の高速近似解法として,時間・周波数・空間共分散行列をそれぞれ同時対角化可能なものに制限した高速MCTF (FastMCTF) を提案する.本手法は,CTFにおけるテンソルの各次元の共分散行列を同時対角化可能なものに制限した高速CTF (FastCTF, 独立低ランクテンソル分析 (ILRTA)と等価) の多チャネル拡張とみることもでき,補助関数に基づく収束保証付きのパラメータ推定法が導出できる.複数の話者の音声を含む混合音を対象とした分離実験により,提案法の効果を検証する. |
抄録(英) | |
キーワード(和) | ブラインド音源分離 / 同時対角化 / 非負値行列分解 / 相関テンソル分解 / 独立低ランクテンソル分析 |
キーワード(英) | |
資料番号 | EA2019-102,SIP2019-104,SP2019-51 |
発行日 | 2020-02-24 (EA, SIP, SP) |
研究会情報 | |
研究会 | SP / EA / SIP |
---|---|
開催期間 | 2020/3/2(から2日開催) |
開催地(和) | 沖縄産業支援センター |
開催地(英) | Okinawa Industry Support Center |
テーマ(和) | 音声,応用/電気音響,信号処理,一般 |
テーマ(英) | |
委員長氏名(和) | 河井 恒(NICT) / 古家 賢一(大分大) / 相川 直幸(東京理科大) |
委員長氏名(英) | Hisashi Kawai(NICT) / Kenichi Furuya(Oita Univ.) / Naoyuki Aikawa(TUS) |
副委員長氏名(和) | 李 晃伸(名工大) / 島内 末廣(金沢工大) / 武岡 成人(静岡理工科大) / 林 和則(阪市大) / 坂東 幸浩(NTT) |
副委員長氏名(英) | Akinobu Ri(Nagoya Inst. of Tech.) / Suehiro Shimauchi(Kanazawa Inst. of Tech.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Kazunori Hayashi(Osaka City Univ) / Yukihiro Bandou(NTT) |
幹事氏名(和) | 南條 浩輝(京大) / 小川 哲司(早大) / 松井 健太郎(NHK) / 小山 翔一(東大) / 中本 昌由(広島大) / 小西 克巳(法政大) |
幹事氏名(英) | Hiroaki Nanjo(Kyoto Univ.) / Tetsuji Ogawa(Waseda Univ.) / Kentaro Matsui(NHK) / Shoichi Koyama(Univ. of Tokyo) / Masayoshi Nakamoto(Hiroshima Univ.) / Katsumi Konishi(Hosei Univ.) |
幹事補佐氏名(和) | 郡山 知樹(東大) / 井島 勇祐(NTT) / 井本 桂右(立命館大) / 森川 大輔(富山県立大) / 杉本 憲治郎(早大) |
幹事補佐氏名(英) | Tomoki Koriyama(Univ. of Tokyo) / Yusuke Ijima(NTT) / Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.) / Kenjiro Sugimoto(Waseda Univ.) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Speech / Technical Committee on Engineering Acoustics / Technical Committee on Signal Processing |
---|---|
本文の言語 | JPN-ONLY |
タイトル(和) | ブラインド音源分離のための高速多チャネル相関テンソル分解 |
サブタイトル(和) | |
タイトル(英) | |
サブタイトル(和) | |
キーワード(1)(和/英) | ブラインド音源分離 |
キーワード(2)(和/英) | 同時対角化 |
キーワード(3)(和/英) | 非負値行列分解 |
キーワード(4)(和/英) | 相関テンソル分解 |
キーワード(5)(和/英) | 独立低ランクテンソル分析 |
第 1 著者 氏名(和/英) | 吉井 和佳 / Kazuyoshi Yoshii |
第 1 著者 所属(和/英) | 京都大学/理化学研究所(略称:京大/理研) Kyoto University/RIKEN(略称:Kyoto Univ./RIKEN) |
第 2 著者 氏名(和/英) | 関口 航平 / Kouhei Sekiguchi |
第 2 著者 所属(和/英) | 理化学研究所/京都大学(略称:理研/京大) RIKEN/Kyoto University(略称:RIKEN/Kyoto Univ.) |
第 3 著者 氏名(和/英) | 坂東 宜昭 / Yoshiaki Bando |
第 3 著者 所属(和/英) | 産業技術総合研究所(略称:産総研) National Institute of Advanced Industrial Science and Technology(略称:AIST) |
第 4 著者 氏名(和/英) | Mathieu Fontaine / Mathieu Fontaine |
第 4 著者 所属(和/英) | 理化学研究所(略称:理研) RIKEN(略称:RIKEN) |
第 5 著者 氏名(和/英) | Aditya Arie Nugraha / Aditya Arie Nugraha |
第 5 著者 所属(和/英) | 理化学研究所(略称:理研) RIKEN(略称:RIKEN) |
発表年月日 | 2020-03-02 |
資料番号 | EA2019-102,SIP2019-104,SP2019-51 |
巻番号(vol) | vol.119 |
号番号(no) | EA-439,SIP-440,SP-441 |
ページ範囲 | pp.7-12(EA), pp.7-12(SIP), pp.7-12(SP), |
ページ数 | 6 |
発行日 | 2020-02-24 (EA, SIP, SP) |