電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2018-03-20 14:20
音声強調のための深層ニューラルネットワーク構造の検討
杉浦陽介島村徹也埼玉大EA2017-171 SIP2017-180 SP2017-154
抄録 (和) 本稿では,音声強調に向けた深層ニューラルネットワークの構造を検討する.音声強調においては,無音区間での雑音の抑制,有音区間におけるスペクトル包絡の保持が大きな課題となる.しかし特徴量である振幅スペクトルのもつ大きなばらつきと,また回帰問題の複雑性からネットワークがアンダーフィッティングして音質が劣化していた.そこで本稿では,音声強調におけるスペクトルゲイン関数を最適化する変数として扱うことで解空間を制約し問題の複雑性を緩和する.加えて,音声スペクトルの分布に基づき損失関数を適切に設計することで,音声強調性能の向上を試みる. 
(英) In this paper, we study a structure of a deep neural network for speech enhancement.In speech enhancement, it is a big issue to suppress the noise in the silent interval and maintain a spectral envelope in the voiced interval, simultaneously. Because of a large variability of the amplitude spectrum, which is one of the features, and the complexity of the regression problems, the network has an under-fitting and then the speech quality is degraded. This paper, thus, relaxes the complexity of the problem by constraining a solution space to optimize an spectral gain of speech enhancement. Additionally, this paper tries to improve the speech enhancement performance by designing a loss function appropriately according to the distribution of the speech spectrum.
キーワード (和) 音声強調 / 深層学習 / / / / / /  
(英) Speech Enhancement / Deep Neural Network / / / / / /  
文献情報 信学技報, vol. 117, no. 517, SP2017-154, pp. 379-384, 2018年3月.
資料番号 SP2017-154 
発行日 2018-03-12 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EA2017-171 SIP2017-180 SP2017-154

研究会情報
研究会 SIP EA SP MI  
開催期間 2018-03-19 - 2018-03-20 
開催地(和) 石垣島 ホテルミヤヒラ 
開催地(英)  
テーマ(和) 音声,応用/電気音響,信号処理,一般 [SIP,EA,SP]/ 医用画像工学一般 [MI] 
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics [SIP, EA, SP]/ Medical Image Engineering, Analysis, Recognition, etc. [MI] 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2018-03-SIP-EA-SP-MI 
本文の言語 日本語 
タイトル(和) 音声強調のための深層ニューラルネットワーク構造の検討 
サブタイトル(和)  
タイトル(英) A Study on Structure of Deep Neural Network for Speech Enhancement 
サブタイトル(英)  
キーワード(1)(和/英) 音声強調 / Speech Enhancement  
キーワード(2)(和/英) 深層学習 / Deep Neural Network  
キーワード(3)(和/英) /  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 杉浦 陽介 / Yosuke Sugiura / スギウラ ヨウスケ
第1著者 所属(和/英) 埼玉大学 (略称: 埼玉大)
Saitama University (略称: Saitama Univ.)
第2著者 氏名(和/英/ヨミ) 島村 徹也 / Tetsuya Shimamura / シマムラ テツヤ
第2著者 所属(和/英) 埼玉大学 (略称: 埼玉大)
Saitama University (略称: Saitama Univ.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2018-03-20 14:20:00 
発表時間 25 
申込先研究会 SP 
資料番号 IEICE-EA2017-171,IEICE-SIP2017-180,IEICE-SP2017-154 
巻番号(vol) IEICE-117 
号番号(no) no.515(EA), no.516(SIP), no.517(SP) 
ページ範囲 pp.379-384 
ページ数 IEICE-6 
発行日 IEICE-EA-2018-03-12,IEICE-SIP-2018-03-12,IEICE-SP-2018-03-12 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会