電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン (ESS/通ソ/ISS)
技報アーカイブ (エレソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2017-03-01 12:40
[ポスター講演]調波構造に基づくDeep Auto Encoderを用いた残響下音声強調
太田陸斗若林佑幸福森隆寛中山雅人西浦敬信立命館大
技報オンラインサービス実施中
抄録 (和) 本稿では,調波構造に基づくDeep Auto Encoder(DAE)を用いた残響下音声強調手法について述べる.DAE とは回帰タスクのためのDeep Neural Network(DNN)のことである.最近,対数パワースペクトルを特徴量とし,残響が重畳された音声からクリーン音声を復元するDAE が検討されている.しかしながら,残響構造の複雑さゆえにモデルの最適化が困難となり,強調音声のスペクトル(特に調波構造)が十分に復元されない問題がある.そこで本稿では,残響音声から抽出した調波構造によりDAE の入力特徴量を拡張することで残響下音声強調の性能向上を目指す.また,調波構造を正確に抽出するため,連続スペクトル減算により残響に頑健なF0 推定を検討する.最後に,提案手法の有効性を確認するため客観評価実験を実施した.客観評価実験では,調波構造の抽出精度を評価した後,強調音声の音声品質をPESQ によって評価した.実験の結果より,入力特徴量に調波構造を追加することでPESQ スコアが改善し,高い音声品質を保持できることを確認した. 
(英) This paper describes reverberant speech enhancement (RSE) with deep auto encoder (DAE) based on harmonic structure. DAEs have been also investigated for RSE based on log power spectra. However, these methods are unable to accurately restore harmonics because it is difficult to optimize the DAE model. Therefore, we proposed an approach to RSE adopting DAE augmented with harmonic structure as input. In addition, we investigate reverberation robust F0 estimation using continuous spectral subtraction in order to accurately extract the harmonic structure. We evaluated the speech quality by PESQ. As a result, we confirmed an effectiveness of the proposed method.
キーワード (和) 残響下音声強調 / DNN / deep auto encoder / 調波構造 / 連続スペクトル減算 / / /  
(英) reverberant speech enhancement / DNN / deep auto encoder / harmonic structure / continuous spectral subtraction / / /  
文献情報 信学技報, vol. 116, no. 477, SP2016-102, pp. 141-146, 2017年3月.
資料番号 SP2016-102 
発行日 2017-02-22 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 SP SIP EA  
開催期間 2017-03-01 - 2017-03-02 
開催地(和) 沖縄産業支援センター 
開催地(英) Okinawa Industry Support Center 
テーマ(和) 音声,応用/電気音響,信号処理,一般 
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2017-03-SP-SIP-EA 
本文の言語 日本語 
タイトル(和) 調波構造に基づくDeep Auto Encoderを用いた残響下音声強調 
サブタイトル(和)  
タイトル(英) Reverberant speech enhancement with deep auto encoder based on harmonic structure 
サブタイトル(英)  
キーワード(1)(和/英) 残響下音声強調 / reverberant speech enhancement  
キーワード(2)(和/英) DNN / DNN  
キーワード(3)(和/英) deep auto encoder / deep auto encoder  
キーワード(4)(和/英) 調波構造 / harmonic structure  
キーワード(5)(和/英) 連続スペクトル減算 / continuous spectral subtraction  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 太田 陸斗 / Rikuto Ota / オオタ リクト
第1著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第2著者 氏名(和/英/ヨミ) 若林 佑幸 / Yukoh Wakabayashi / ワカバヤシ ユウコウ
第2著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第3著者 氏名(和/英/ヨミ) 福森 隆寛 / Takahiro Fukumori / フクモリ タカヒロ
第3著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第4著者 氏名(和/英/ヨミ) 中山 雅人 / Masato Nakayama / ナカヤマ マサト
第4著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第5著者 氏名(和/英/ヨミ) 西浦 敬信 / Takanobu Nishiura / ニシウラ タカノブ
第5著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2017-03-01 12:40:00 
発表時間 90 
申込先研究会 SP 
資料番号 IEICE-EA2016-107,IEICE-SIP2016-162,IEICE-SP2016-102 
巻番号(vol) IEICE-116 
号番号(no) no.475(EA), no.476(SIP), no.477(SP) 
ページ範囲 pp.141-146 
ページ数 IEICE-6 
発行日 IEICE-EA-2017-02-22,IEICE-SIP-2017-02-22,IEICE-SP-2017-02-22 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会