講演名 | 2018-03-20 [ポスター講演]ブラインド音源分離のための高速相関テンソル分解 北村 昂一(京大), 坂東 宜昭(京大), 糸山 克寿(京大), 吉井 和佳(京大/理研), 河原 達也(京大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿では,シングルチャネル音源分離のための複素$t$分布に基づく高速相関テンソル分解 (高速$t$-CTF) について述べる.相関テンソル分解 (CTF) は,非負値行列分解 (NMF) や半正定値テンソル分解 (PSDTF) の拡張となっており,複素スペクトログラムの周波数方向および時間方向の相関を考慮した音源分離が可能である.しかし,莫大な計算量のため現実的には実行が困難であり,混合音のスペクトログラムが複素ガウス分布に従うという強い仮定が置かれている問題があった.本研究ではまず,相関行列の同時対角化に基づくCTFの高速近似法を提案する.高速CTFでは,複素スペクトログラムの周波数方向および時間方向の相関を無相関化する変換行列の推定と,変換後の空間での非負値行列分解 (NMF) を同時に行う.次に,混合音のスペクトログラムが複素$t$分布に従うことを仮定した高速$t$-CTFを導出する.複素$t$分布は,複素対称$alpha$安定分布と同様に,複素コーシー分布および複素ガウス分布を特殊形として含む裾の重い確率分布であるが,一般に再生性を持たないかわりに,すべての自由度について確率密度関数が陽にかける利点を持ち,最尤推定を行う上で都合がよい.音源分離実験から,高速$t$-CTFの特殊形である高速PSDTFはNMFよりも高い音源分離精度を持つことを示した. |
抄録(英) | |
キーワード(和) | 相関テンソル分解 / 半正定値テンソル分解 / 非負値行列分解 / 複素t分布 / 同時対角化 |
キーワード(英) | |
資料番号 | EA2017-144,SIP2017-153,SP2017-127 |
発行日 | 2018-03-12 (EA, SIP, SP) |
研究会情報 | |
研究会 | SIP / EA / SP / MI |
---|---|
開催期間 | 2018/3/19(から2日開催) |
開催地(和) | 石垣島 ホテルミヤヒラ |
開催地(英) | |
テーマ(和) | 音声,応用/電気音響,信号処理,一般 [SIP,EA,SP]/ 医用画像工学一般 [MI] |
テーマ(英) | Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics [SIP, EA, SP]/ Medical Image Engineering, Analysis, Recognition, etc. [MI] |
委員長氏名(和) | 奥田 正浩(北九州市大) / 島内 末廣(NTT) / 山下 洋一(立命館大) / 森 健策(名大) |
委員長氏名(英) | Masahiro Okuda(Univ. of Kitakyushu) / Suehiro Shimauchi(NTT) / Yoichi Yamashita(Ritsumeikan Univ.) / Kensaku Mori(Nagoya Univ.) |
副委員長氏名(和) | 村松 正吾(新潟大) / 相川 直幸(東京理科大) / 水町 光徳(九州工業大) / 森 大毅(宇都宮大) / 河田 佳樹(徳島大) / 木村 裕一(近畿大) |
副委員長氏名(英) | Shogo Muramatsu(Niigata Univ.) / Naoyuki Aikawa(TUS) / Mitsunori Mizumachi(Kyutech) / Hiroki Mori(Utsunomiya Univ.) / Yoshiki Kawata(Tokushima Univ.) / Yuichi Kimura(Kinki Univ.) |
幹事氏名(和) | 宮田 高道(千葉工大) / 渡邊 修(拓殖大) / 渡邉 貫治(秋田県立大) / 武岡 成人(静岡理工科大) / 西田 昌史(静岡大) / 坂野 秀樹(名城大) / 北坂 孝幸(愛知工大) / 本谷 秀堅(名工大) |
幹事氏名(英) | Takamichi Miyata(Chiba Inst. of Tech.) / Osamu Watanabe(Takushoku Univ.) / Kanji Watanabe(Akita Pref. Univ.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Masafumi Nishida(Shizuoka Univ.) / Hideki Banno(Meijo Univ.) / Takayuki Kitasaka(Aichi Inst. of Tech.) / Hidekata Hontani(Nagoya Inst. of Tech.) |
幹事補佐氏名(和) | 中本 昌由(広島大) / TREVINO Jorge(東北大) / 伊藤 信貴(NTT) / 橋本 佳(名工大) / 小橋川 哲(NTT) / 原口 亮(兵庫県立大) / 平野 靖(山口大) |
幹事補佐氏名(英) | Masayoshi Nakamoto(Hiroshima Univ.ひろ) / TREVINO Jorge(Tohoku Univ.) / Nobutaka Ito(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Satoshi Kobashikawa(NTT) / Ryo Haraguchi(Univ. of Hyogo) / Yasushi Hirano(Yamaguchi Univ.) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Signal Processing / Technical Committee on Engineering Acoustics / Technical Committee on Speech / Technical Committee on Medical Imaging |
---|---|
本文の言語 | JPN-ONLY |
タイトル(和) | [ポスター講演]ブラインド音源分離のための高速相関テンソル分解 |
サブタイトル(和) | |
タイトル(英) | |
サブタイトル(和) | |
キーワード(1)(和/英) | 相関テンソル分解 |
キーワード(2)(和/英) | 半正定値テンソル分解 |
キーワード(3)(和/英) | 非負値行列分解 |
キーワード(4)(和/英) | 複素t分布 |
キーワード(5)(和/英) | 同時対角化 |
第 1 著者 氏名(和/英) | 北村 昂一 / Koichi Kitamura |
第 1 著者 所属(和/英) | 京都大学(略称:京大) Kyoto University(略称:Kyoto Univ.) |
第 2 著者 氏名(和/英) | 坂東 宜昭 / Yoshiaki Bando |
第 2 著者 所属(和/英) | 京都大学(略称:京大) Kyoto University(略称:Kyoto Univ.) |
第 3 著者 氏名(和/英) | 糸山 克寿 / Katsutoshi Itoyama |
第 3 著者 所属(和/英) | 京都大学(略称:京大) Kyoto University(略称:Kyoto Univ.) |
第 4 著者 氏名(和/英) | 吉井 和佳 / Kazuyoshi Yoshii |
第 4 著者 所属(和/英) | 京都大学/理研(略称:京大/理研) Kyoto University/RIKEN(略称:Kyoto Univ./RIKEN) |
第 5 著者 氏名(和/英) | 河原 達也 / Tatsuya Kawahara |
第 5 著者 所属(和/英) | 京都大学(略称:京大) Kyoto University(略称:Kyoto Univ.) |
発表年月日 | 2018-03-20 |
資料番号 | EA2017-144,SIP2017-153,SP2017-127 |
巻番号(vol) | vol.117 |
号番号(no) | EA-515,SIP-516,SP-517 |
ページ範囲 | pp.235-240(EA), pp.235-240(SIP), pp.235-240(SP), |
ページ数 | 6 |
発行日 | 2018-03-12 (EA, SIP, SP) |