講演名 2017-03-01
[ポスター講演]調波構造に基づくDeep Auto Encoderを用いた残響下音声強調
太田 陸斗(立命館大), 若林 佑幸(立命館大), 福森 隆寛(立命館大), 中山 雅人(立命館大), 西浦 敬信(立命館大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,調波構造に基づくDeep Auto Encoder(DAE)を用いた残響下音声強調手法について述べる.DAE とは回帰タスクのためのDeep Neural Network(DNN)のことである.最近,対数パワースペクトルを特徴量とし,残響が重畳された音声からクリーン音声を復元するDAE が検討されている.しかしながら,残響構造の複雑さゆえにモデルの最適化が困難となり,強調音声のスペクトル(特に調波構造)が十分に復元されない問題がある.そこで本稿では,残響音声から抽出した調波構造によりDAE の入力特徴量を拡張することで残響下音声強調の性能向上を目指す.また,調波構造を正確に抽出するため,連続スペクトル減算により残響に頑健なF0 推定を検討する.最後に,提案手法の有効性を確認するため客観評価実験を実施した.客観評価実験では,調波構造の抽出精度を評価した後,強調音声の音声品質をPESQ によって評価した.実験の結果より,入力特徴量に調波構造を追加することでPESQ スコアが改善し,高い音声品質を保持できることを確認した.
抄録(英) This paper describes reverberant speech enhancement (RSE) with deep auto encoder (DAE) based on harmonic structure. DAEs have been also investigated for RSE based on log power spectra. However, these methods are unable to accurately restore harmonics because it is difficult to optimize the DAE model. Therefore, we proposed an approach to RSE adopting DAE augmented with harmonic structure as input. In addition, we investigate reverberation robust F0 estimation using continuous spectral subtraction in order to accurately extract the harmonic structure. We evaluated the speech quality by PESQ. As a result, we confirmed an effectiveness of the proposed method.
キーワード(和) 残響下音声強調 / DNN / deep auto encoder / 調波構造 / 連続スペクトル減算
キーワード(英) reverberant speech enhancement / DNN / deep auto encoder / harmonic structure / continuous spectral subtraction
資料番号 EA2016-107,SIP2016-162,SP2016-102
発行日 2017-02-22 (EA, SIP, SP)

研究会情報
研究会 SP / SIP / EA
開催期間 2017/3/1(から2日開催)
開催地(和) 沖縄産業支援センター
開催地(英) Okinawa Industry Support Center
テーマ(和) 音声,応用/電気音響,信号処理,一般
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics
委員長氏名(和) 間野 一則(芝浦工大) / 中静 真(千葉工大) / 水町 光徳(九工大)
委員長氏名(英) Kazunori Mano(Shibaura Inst. of Tech.) / Makoto Nakashizuka(Chiba Inst. of Tech.) / Mitsunori Mizumachi(Kyushu Inst. of Tech.)
副委員長氏名(和) 森 大毅(宇都宮大) / 奥田 正浩(北九州市大) / 村松 正吾(新潟大) / 羽田 陽一(電通大) / 島内 末廣(NTT)
副委員長氏名(英) Hiroki Mori(Utsunomiya Univ.) / Masahiro Okuda(Univ. of Kitakyushu) / Shogo Muramatsu(Niigata Univ.) / Yoichi Haneda(Univ. of Electro-Comm.) / Suehiro Shimauchi(NTT)
幹事氏名(和) 滝口 哲也(神戸大) / 西田 昌史(静岡大) / 平林 晃(立命館大) / 宮田 高道(千葉工大) / 堀内 俊治(KDDI研) / 渡邉 貫治(秋田県立大)
幹事氏名(英) Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.) / Akira Hirabayashi(Ritsumeikan Univ.) / Takamichi Miyata(Chiba Inst. of Tech.) / Toshiharu Horiuchi(KDDI R&D Labs.) / Kanji Watanabe(Akita Pref. Univ.)
幹事補佐氏名(和) 浅見 太一(NTT) / 橋本 佳(名工大) / 渡邊 修(拓殖大) / 武岡 成人(静岡理工科大) / TREVINO Jorge(東北大)
幹事補佐氏名(英) Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Osamu Watanabe(Takushoku Univ.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / TREVINO Jorge(Tohoku Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Technical Committee on Signal Processing / Technical Committee on Engineering Acoustics
本文の言語 JPN
タイトル(和) [ポスター講演]調波構造に基づくDeep Auto Encoderを用いた残響下音声強調
サブタイトル(和)
タイトル(英) [Poster Presentation] Reverberant speech enhancement with deep auto encoder based on harmonic structure
サブタイトル(和)
キーワード(1)(和/英) 残響下音声強調 / reverberant speech enhancement
キーワード(2)(和/英) DNN / DNN
キーワード(3)(和/英) deep auto encoder / deep auto encoder
キーワード(4)(和/英) 調波構造 / harmonic structure
キーワード(5)(和/英) 連続スペクトル減算 / continuous spectral subtraction
第 1 著者 氏名(和/英) 太田 陸斗 / Rikuto Ota
第 1 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 2 著者 氏名(和/英) 若林 佑幸 / Yukoh Wakabayashi
第 2 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 3 著者 氏名(和/英) 福森 隆寛 / Takahiro Fukumori
第 3 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 4 著者 氏名(和/英) 中山 雅人 / Masato Nakayama
第 4 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 5 著者 氏名(和/英) 西浦 敬信 / Takanobu Nishiura
第 5 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
発表年月日 2017-03-01
資料番号 EA2016-107,SIP2016-162,SP2016-102
巻番号(vol) vol.116
号番号(no) EA-475,SIP-476,SP-477
ページ範囲 pp.141-146(EA), pp.141-146(SIP), pp.141-146(SP),
ページ数 6
発行日 2017-02-22 (EA, SIP, SP)