［招待講演］空間モデルを考慮した深層学習ベースの音源分離

戸上 真人

講演名	2021-03-03 ［招待講演］空間モデルを考慮した深層学習ベースの音源分離戸上真人(LINE),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	深層学習ベースの音源分離の進化が著しいが，ニューラルネットワーク(NN)は空間モデルとは独立に学習されることが多い。しかし，そのような構成で学習されたNNは，空間モデルを用いて音源分離を行う構成において本当に最適であるといえるのかという疑問が残る。本講演では従来の統計モデルに基づく音源分離および深層学習を用いた音源分離の研究の流れを示すと共に，深層学習を用いた音源分離に空間モデルを取り込み，NNを空間モデルを考慮して学習する方法として近年著者らが進めている4つの方向性，1)空間モデルの影響を考慮したNNの損失関数，2)NNの構造の中に空間モデルを用いた音源分離を埋め込む方法，3)所望音源の到来方向の情報をアトラクタとして用いて音源分離に必要なパラメータを推定するフレームワーク，4)統計モデルに基づく音源分離法を疑似教師信号生成機として用いる教師無しNN学習法を紹介する。
抄録(英)	Recently, deep learning based speech source separation has been evolved rapidly. A neural network (NN) is usually learned independently of a spatial model. However, a research question remains whether the NN that is trained such as configuration is really optimal when speech source separation is performed with the spatial model. In this talk, I will introduce conventional statistical model based speech source separation and deep learning based speech source separation. After that, I will introduce four research directions which incorporate a spatial model into the NN structure, i.e. 1) Loss function of the NN that considers the spatial model, 2)Insertion of speech source separation with the spatial model into the NN structure, 3) A NN framework which estimates parameters for speech source separation with a direction-of-arrival attractor, and 4) Unsupervised learning of NN which utilizes statistical model based speech source separation as a pseudo clean signal generator.
キーワード(和)	空間モデル / 音源分離 / 深層学習 / 教師無学習
キーワード(英)	spatial model / speech source separation / deep learning / unsupervised learning
資料番号	EA2020-64,SIP2020-95,SP2020-29
発行日	2021-02-24 (EA, SIP, SP)

研究会情報
研究会	EA / US / SP / SIP / IPSJ-SLP
開催期間	2021/3/3(から2日開催)
開催地（和）	オンライン開催
開催地（英）	Online
テーマ（和）	音声,応用／電気音響,信号処理，超音波，一般
テーマ（英）	Speech, Engineering/Electro Acoustics, Signal Processing, Ultrasonics, and Related Topics
委員長氏名（和）	古家賢一(大分大) / 三浦光(日大) / 河井恒(NICT) / 林和則(京大) / 北岡教英(豊橋技科大)
委員長氏名（英）	Kenichi Furuya(Oita Univ.) / Hikaru Miura(Nihon Univ.) / Hisashi Kawai(NICT) / Kazunori Hayashi(Kyoto Univ.) / 北岡教英(豊橋技科大)
副委員長氏名（和）	梶川嘉延(関西大) / 松井健太郎(NHK) / 近藤淳(静岡大) / 小池義和(芝浦工大) / / 坂東幸浩(NTT) / 田中聡久(東京農工大)
副委員長氏名（英）	Yoshinobu Kajikawa(Kansai Univ.) / Kentaro Matsui(NHK) / Jun Kondo(Shizuoka Univ.) / Yoshikazu Koike(Shibaura Inst. of Tech.) / / Yukihiro Bandou(NTT) / Toshihisa Tanaka(Tokyo Univ. Agri.&Tech.)
幹事氏名（和）	小山翔一(東大) / 加古達也(NTT) / 小山大介(同志社大) / 荒川元孝(東北大) / 高道慎之介(東大) / 小川哲司(早大) / 小西克巳(法政大) / 杉本憲治郎(早大) / 秋田祐哉(京大) / 太刀岡勇気(デンソーアイティーラボラトリ) / 高島遼一(神戸大) / 高道慎之介(東大)
幹事氏名（英）	Shoichi Koyama(Univ. of Tokyo) / Tatsuya Kako(NTT) / Daisuke Koyama(Doshisha Univ.) / Mototaka Arakawa(Tohoku Univ.) / Shinnosuke Takamichi(Univ. of Tokyo) / Tetsuji Ogawa(Waseda Univ.) / Katsumi Konishi(Hosei Univ.) / Kenjiro Sugimoto(Waseda Univ.) / 秋田祐哉(京大) / 太刀岡勇気(デンソーアイティーラボラトリ) / 高島遼一(神戸大) / 高道慎之介(東大)
幹事補佐氏名（和）	若林佑幸(都立大) / 小松達也(LINE) / 平田慎之介(東工大) / 井島勇祐(NTT) / 田中雄一(東京農工大)
幹事補佐氏名（英）	Yukou Wakabayashi(Tokyo Metropolitan Univ.) / Tatsuya Komatsu(LINE) / Shinnosuke Hirata(Tokyo Inst. of Tech.) / Yusuke Ijima(NTT) / Yuichi Tanaka(Tokyo Univ. Agri.&Tech.)

講演論文情報詳細
申込み研究会	Technical Committee on Engineering Acoustics / Technical Committee on Ultrasonics / Technical Committee on Speech / Technical Committee on Signal Processing / Special Interest Group on Spoken Language Processing
本文の言語	JPN
タイトル（和）	［招待講演］空間モデルを考慮した深層学習ベースの音源分離
サブタイトル（和）
タイトル（英）
サブタイトル（和）
キーワード(1)（和/英）	空間モデル / spatial model
キーワード(2)（和/英）	音源分離 / speech source separation
キーワード(3)（和/英）	深層学習 / deep learning
キーワード(4)（和/英）	教師無学習 / unsupervised learning
第 1 著者氏名（和/英）	戸上真人 / Masahito Togami
第 1 著者所属（和/英）	LINE(略称：LINE) LINE(略称：LINE)
発表年月日	2021-03-03
資料番号	EA2020-64,SIP2020-95,SP2020-29
巻番号（vol）	vol.120
号番号（no）	EA-397,SIP-398,SP-399
ページ範囲	pp.27-32(EA), pp.27-32(SIP), pp.27-32(SP),
ページ数	6
発行日	2021-02-24 (EA, SIP, SP)