講演名 2021-03-03
[招待講演]空間モデルを考慮した深層学習ベースの音源分離
戸上 真人(LINE),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 深層学習ベースの音源分離の進化が著しいが,ニューラルネットワーク(NN)は空間モデルとは独立に学習されることが多い。しかし,そのような構成で学習されたNNは,空間モデルを用いて音源分離を行う構成において本当に最適であるといえるのかという疑問が残る。本講演では従来の統計モデルに基づく音源分離および深層学習を用いた音源分離の研究の流れを示すと共に,深層学習を用いた音源分離に空間モデルを取り込み,NNを空間モデルを考慮して学習する方法として近年著者らが進めている4つの方向性,1)空間モデルの影響を考慮したNNの損失関数,2)NNの構造の中に空間モデルを用いた音源分離を埋め込む方法,3)所望音源の到来方向の情報をアトラクタとして用いて音源分離に必要なパラメータを推定するフレームワーク,4)統計モデルに基づく音源分離法を疑似教師信号生成機として用いる教師無しNN学習法を紹介する。
抄録(英) Recently, deep learning based speech source separation has been evolved rapidly. A neural network (NN) is usually learned independently of a spatial model. However, a research question remains whether the NN that is trained such as configuration is really optimal when speech source separation is performed with the spatial model. In this talk, I will introduce conventional statistical model based speech source separation and deep learning based speech source separation. After that, I will introduce four research directions which incorporate a spatial model into the NN structure, i.e. 1) Loss function of the NN that considers the spatial model, 2)Insertion of speech source separation with the spatial model into the NN structure, 3) A NN framework which estimates parameters for speech source separation with a direction-of-arrival attractor, and 4) Unsupervised learning of NN which utilizes statistical model based speech source separation as a pseudo clean signal generator.
キーワード(和) 空間モデル / 音源分離 / 深層学習 / 教師無学習
キーワード(英) spatial model / speech source separation / deep learning / unsupervised learning
資料番号 EA2020-64,SIP2020-95,SP2020-29
発行日 2021-02-24 (EA, SIP, SP)

研究会情報
研究会 EA / US / SP / SIP / IPSJ-SLP
開催期間 2021/3/3(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 音声,応用/電気音響,信号処理,超音波,一般
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, Ultrasonics, and Related Topics
委員長氏名(和) 古家 賢一(大分大) / 三浦 光(日大) / 河井 恒(NICT) / 林 和則(京大) / 北岡 教英(豊橋技科大)
委員長氏名(英) Kenichi Furuya(Oita Univ.) / Hikaru Miura(Nihon Univ.) / Hisashi Kawai(NICT) / Kazunori Hayashi(Kyoto Univ.) / 北岡 教英(豊橋技科大)
副委員長氏名(和) 梶川 嘉延(関西大) / 松井 健太郎(NHK) / 近藤 淳(静岡大) / 小池 義和(芝浦工大) / / 坂東 幸浩(NTT) / 田中 聡久(東京農工大)
副委員長氏名(英) Yoshinobu Kajikawa(Kansai Univ.) / Kentaro Matsui(NHK) / Jun Kondo(Shizuoka Univ.) / Yoshikazu Koike(Shibaura Inst. of Tech.) / / Yukihiro Bandou(NTT) / Toshihisa Tanaka(Tokyo Univ. Agri.&Tech.)
幹事氏名(和) 小山 翔一(東大) / 加古 達也(NTT) / 小山 大介(同志社大) / 荒川 元孝(東北大) / 高道 慎之介(東大) / 小川 哲司(早大) / 小西 克巳(法政大) / 杉本 憲治郎(早大) / 秋田 祐哉(京大) / 太刀岡 勇気(デンソーアイティーラボラトリ) / 高島 遼一(神戸大) / 高道 慎之介(東大)
幹事氏名(英) Shoichi Koyama(Univ. of Tokyo) / Tatsuya Kako(NTT) / Daisuke Koyama(Doshisha Univ.) / Mototaka Arakawa(Tohoku Univ.) / Shinnosuke Takamichi(Univ. of Tokyo) / Tetsuji Ogawa(Waseda Univ.) / Katsumi Konishi(Hosei Univ.) / Kenjiro Sugimoto(Waseda Univ.) / 秋田 祐哉(京大) / 太刀岡 勇気(デンソーアイティーラボラトリ) / 高島 遼一(神戸大) / 高道 慎之介(東大)
幹事補佐氏名(和) 若林 佑幸(都立大) / 小松 達也(LINE) / 平田 慎之介(東工大) / 井島 勇祐(NTT) / 田中 雄一(東京農工大)
幹事補佐氏名(英) Yukou Wakabayashi(Tokyo Metropolitan Univ.) / Tatsuya Komatsu(LINE) / Shinnosuke Hirata(Tokyo Inst. of Tech.) / Yusuke Ijima(NTT) / Yuichi Tanaka(Tokyo Univ. Agri.&Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Technical Committee on Ultrasonics / Technical Committee on Speech / Technical Committee on Signal Processing / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) [招待講演]空間モデルを考慮した深層学習ベースの音源分離
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 空間モデル / spatial model
キーワード(2)(和/英) 音源分離 / speech source separation
キーワード(3)(和/英) 深層学習 / deep learning
キーワード(4)(和/英) 教師無学習 / unsupervised learning
第 1 著者 氏名(和/英) 戸上 真人 / Masahito Togami
第 1 著者 所属(和/英) LINE(略称:LINE)
LINE(略称:LINE)
発表年月日 2021-03-03
資料番号 EA2020-64,SIP2020-95,SP2020-29
巻番号(vol) vol.120
号番号(no) EA-397,SIP-398,SP-399
ページ範囲 pp.27-32(EA), pp.27-32(SIP), pp.27-32(SP),
ページ数 6
発行日 2021-02-24 (EA, SIP, SP)