講演名 2019-03-14
[ポスター講演]敵対的デノイジングオートエンコーダを用いた拡散性雑音除去
田辺 ひかり(早大), 俵 直弘(早大), 小林 哲則(早大), 藤枝 大(OKI), 片桐 一浩(OKI), 矢頭 隆(OKI), 小川 哲司(早大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究ではプレフィルタと敵対的デノイジングオートエンコーダ(aDAE)を組み合わせたモデルによる拡散性雑音除去を試みた.拡散性雑音は多数の雑音源または面音源に起因するため,点音源を仮定したアプローチでは対応しきれないという課題がある.深層学習による拡散性除去では仮定を必要とないため効果的に拡散性雑音を除去できると期待できる一方,過学習が起こりやすく学習に用いられていない未知の雑音に対しては性能が劣化してしまうという課題がある.そこで本研究ではプレフィルタによりaDAEの学習を容易化した.プレフィルタはMVDRビームフォーマまたはideal binary masking(idBM)を用いた.またADAEにnoise-aware trainingを導入した.2チャンネル雑音抑圧実験によりプレフィルタをaDAEに組み合わせたモデルがaDAE単体を上回る音声強調性能を達成した.特にMVDRビームフォーマでは全雑音源に死角を向けきれないためにフィルタ単体での性能は高くないにもかかわらず,aDAEと組み合わせることで高い性能を達成した.またMVDRビームフォーマを用いたモデルにおいて,noise-aware trainingが有効であることが確認された.プレフィルタの比較ではidBMよりもMVDRビームフォーマの方がaDAEのプレフィルタとしてより適していることが明らかになった.
抄録(英) In this study, we attempted to remove diffuse noise by a model combining a prefilter and an adversarial denoising autoencoder (aDAE). Since diffuse noise is caused by many noise sources or surface sound sources, it was difficult to remove diffuse noise by approaches assuming point sound sources. Deep learning based methods are expected to remove diffuse noise effectively since they are unnecessary to use assumption, but on the other hand, over fitting is likely to occur and the performance is deteriorated for unknown noise which is not used for training. In order to facilitate learning of aDAE, we used MVDR beamformer or ideal binary masking(idBM) as a pre-filter. We also introduced noise-aware training which feeds aDAE a noise-extracted signal as an auxiliary signal. Experiments using 2 channel microphones showed the effectiveness of pre-filter, aDAE with pre-filter outperformed original aDAE. Although MVDR beamformer cannot direct null angle to all interfering sources and its noise suppression is not strong, high performance is achieved by combining with aDAE. It was confirmed that noise-aware training is effective for aDAE with MVDR beamformer combined. By comparing pre-filters, it was revealed that MVDR beamformer is more suitable as a pre-filter of aDAE than idBM.
キーワード(和) 雑音除去 / 敵対的生成ネットワーク / MVDRビームフォーマ / ideal-binary masking / noise-aware training
キーワード(英) noise reduction / adversarial generative network / MVDR beamformer / ideal-binary masking / noise-aware training
資料番号 EA2018-125,SIP2018-131,SP2018-87
発行日 2019-03-07 (EA, SIP, SP)

研究会情報
研究会 EA / SIP / SP
開催期間 2019/3/14(から2日開催)
開催地(和) アイランド ナガサキ(長崎市)
開催地(英) i+Land nagasaki (Nagasaki-shi)
テーマ(和) 応用/電気音響,信号処理,音声,一般
テーマ(英) Engineering/Electro Acoustics, Signal Processing, Speech, and Related Topics
委員長氏名(和) 島内 末廣(金沢工大) / 村松 正吾(新潟大) / 山下 洋一(立命館大)
委員長氏名(英) Suehiro Shimauchi(Kanazawa Inst. of Tech.) / Shogo Muramatsu(Niigata Univ.) / Yoichi Yamashita(Ritsumeikan Univ.)
副委員長氏名(和) 古家 賢一(大分大) / 渡邉 貫治(秋田県立大) / 相川 直幸(東京理科大) / 林 和則(阪市大) / 李 晃伸(名工大)
副委員長氏名(英) Kenichi Furuya(Oita Univ.) / Kanji Watanabe(Akita Pref. Univ.) / Naoyuki Aikawa(TUS) / Kazunori Hayashi(Osaka City Univ) / Akinobu Ri(Nagoya Inst. of Tech.)
幹事氏名(和) 武岡 成人(静岡理工科大) / 松井 健太郎(NHK) / 渡邊 修(拓殖大) / 中本 昌由(広島大学) / 南條 浩輝(京大) / 坂野 秀樹(名城大)
幹事氏名(英) Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Kentaro Matsui(NHK) / Osamu Watanabe(Takushoku Univ.) / Masayoshi Nakamoto(Hiroshima Univ.) / Hiroaki Nanjo(Kyoto Univ.) / Hideki Banno(Meijo Univ.)
幹事補佐氏名(和) 井本 桂右(立命館大) / 森川 大輔(富山県立大) / 小西 克巳(法政大) / 何 宜欣(拓殖大) / 郡山 知樹(東工大) / 小橋川 哲(NTT)
幹事補佐氏名(英) Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.) / Katsumi Konishi(Hosei Univ.) / hyihsin(Takushoku Univ.) / Tomoki Koriyama(Tokyo Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Technical Committee on Signal Processing / Technical Committee on Speech
本文の言語 JPN
タイトル(和) [ポスター講演]敵対的デノイジングオートエンコーダを用いた拡散性雑音除去
サブタイトル(和)
タイトル(英) [Poster Presentation] Diffuse noise reduction using adversarial denoising autoencoder
サブタイトル(和)
キーワード(1)(和/英) 雑音除去 / noise reduction
キーワード(2)(和/英) 敵対的生成ネットワーク / adversarial generative network
キーワード(3)(和/英) MVDRビームフォーマ / MVDR beamformer
キーワード(4)(和/英) ideal-binary masking / ideal-binary masking
キーワード(5)(和/英) noise-aware training / noise-aware training
第 1 著者 氏名(和/英) 田辺 ひかり / Hikari Tanabe
第 1 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda City University(略称:Waseda Univ.)
第 2 著者 氏名(和/英) 俵 直弘 / Naohiro Tawara
第 2 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda City University(略称:Waseda Univ.)
第 3 著者 氏名(和/英) 小林 哲則 / Tetsunori Kobayashi
第 3 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda City University(略称:Waseda Univ.)
第 4 著者 氏名(和/英) 藤枝 大 / Masaru Fujieda
第 4 著者 所属(和/英) 沖電気工業株式会社(略称:OKI)
OKI Electric Industry Co.(略称:OKI)
第 5 著者 氏名(和/英) 片桐 一浩 / Katagiri Kazuhiro
第 5 著者 所属(和/英) 沖電気工業株式会社(略称:OKI)
OKI Electric Industry Co.(略称:OKI)
第 6 著者 氏名(和/英) 矢頭 隆 / Takashi Yazu
第 6 著者 所属(和/英) 沖電気工業株式会社(略称:OKI)
OKI Electric Industry Co.(略称:OKI)
第 7 著者 氏名(和/英) 小川 哲司 / Tetsuji Ogawa
第 7 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda City University(略称:Waseda Univ.)
発表年月日 2019-03-14
資料番号 EA2018-125,SIP2018-131,SP2018-87
巻番号(vol) vol.118
号番号(no) EA-495,SIP-496,SP-497
ページ範囲 pp.155-160(EA), pp.155-160(SIP), pp.155-160(SP),
ページ数 6
発行日 2019-03-07 (EA, SIP, SP)