お知らせ 研究会の開催と会場に参加される皆様へのお願い(2021年10月開催~)
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2021-03-03 13:05
[招待講演]空間モデルを考慮した深層学習ベースの音源分離
戸上真人LINEEA2020-64 SIP2020-95 SP2020-29
抄録 (和) 深層学習ベースの音源分離の進化が著しいが,ニューラルネットワーク(NN)は空間モデルとは独立に学習されることが多い。しかし,
そのような構成で学習されたNNは,空間モデルを用いて音源分離を行う構成において本当に最適であるといえるのかという疑問が残る。
本講演では従来の統計モデルに基づく音源分離および深層学習を用いた音源分離の研究の流れを示すと共に,
深層学習を用いた音源分離に空間モデルを取り込み,NNを空間モデルを考慮して学習する方法として近年著者らが進めている4つの方向性,
1)空間モデルの影響を考慮したNNの損失関数,2)NNの構造の中に空間モデルを用いた音源分離を埋め込む方法,
3)所望音源の到来方向の情報をアトラクタとして用いて音源分離に必要なパラメータを推定するフレームワーク,4)統計モデルに基づく音源分離法を
疑似教師信号生成機として用いる教師無しNN学習法を紹介する。 
(英) Recently, deep learning based speech source separation has been evolved rapidly. A neural network (NN) is usually learned independently
of a spatial model. However, a research question remains whether the NN that is trained such as configuration is really optimal
when speech source separation is performed with the spatial model. In this talk, I will introduce conventional statistical model based
speech source separation and deep learning based speech source separation. After that, I will introduce four research directions which
incorporate a spatial model into the NN structure, i.e. 1) Loss function of the NN that considers the spatial model, 2)Insertion of speech source separation
with the spatial model into the NN structure, 3) A NN framework which estimates parameters for speech source separation with a direction-of-arrival attractor,
and 4) Unsupervised learning of NN which utilizes statistical model based speech source separation as a pseudo clean signal generator.
キーワード (和) 空間モデル / 音源分離 / 深層学習 / 教師無学習 / / / /  
(英) spatial model / speech source separation / deep learning / unsupervised learning / / / /  
文献情報 信学技報, vol. 120, no. 397, EA2020-64, pp. 27-32, 2021年3月.
資料番号 EA2020-64 
発行日 2021-02-24 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EA2020-64 SIP2020-95 SP2020-29

研究会情報
研究会 EA US SP SIP IPSJ-SLP  
開催期間 2021-03-03 - 2021-03-04 
開催地(和) オンライン開催 
開催地(英) Online 
テーマ(和) 音声,応用/電気音響,信号処理,超音波,一般 
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, Ultrasonics, and Related Topics 
講演論文情報の詳細
申込み研究会 EA 
会議コード 2021-03-EA-US-SP-SIP-SLP 
本文の言語 日本語 
タイトル(和) 空間モデルを考慮した深層学習ベースの音源分離 
サブタイトル(和)  
タイトル(英)
サブタイトル(英)  
キーワード(1)(和/英) 空間モデル / spatial model  
キーワード(2)(和/英) 音源分離 / speech source separation  
キーワード(3)(和/英) 深層学習 / deep learning  
キーワード(4)(和/英) 教師無学習 / unsupervised learning  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 戸上 真人 / Masahito Togami /
第1著者 所属(和/英) LINE (略称: LINE)
LINE (略称: LINE)
第2著者 氏名(和/英/ヨミ) / /
第2著者 所属(和/英) (略称: )
(略称: )
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2021-03-03 13:05:00 
発表時間 50 
申込先研究会 EA 
資料番号 IEICE-EA2020-64,IEICE-SIP2020-95,IEICE-SP2020-29 
巻番号(vol) IEICE-120 
号番号(no) no.397(EA), no.398(SIP), no.399(SP) 
ページ範囲 pp.27-32 
ページ数 IEICE-6 
発行日 IEICE-EA-2021-02-24,IEICE-SIP-2021-02-24,IEICE-SP-2021-02-24 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会