講演名 2018-11-21
カートシスマッチングに基づく低ミュージカルノイズDNN音声強調の評価
溝口 聡(東大), 齋藤 佑樹(東大), 高道 慎之介(東大), 猿渡 洋(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,DNN音声強調にカートシスマッチングを適用し,ミュージカルノイズの発生を低減させる方法を提案する.非線形信号処理によって発生する人工的な歪みをミュージカルノイズと呼び,これは聴覚的不愉快さをもたらすことが知られている.また,ミュージカルノイズの発生量は強調前後のカートシスの上昇と大きな相関があることが知られている.DNN音声強調は,DNNの豊かな表現力によって強力な雑音抑圧性能を誇るが,ミュージカルノイズの発生について考慮していない.本稿では,DNN音声強調にカートシスの上昇を抑えるような正則化,すなわちカートシスマッチングを行うことによって,雑音抑圧性能や音声歪み発生量を維持したまま,低ミュージカルノイズな音声強調を実現する手法を提案する.また,音声強調実験の結果に対して客観評価を行い,提案手法の有効性を示す.
抄録(英) This paper proposes DNN-based speech enhancement with low musical noise by kurtosis matching. Musical noise, artifacts generated by nonlinear signal processing, causes a negative effect on the auditory impression. Quantity of the generated musical noise is significantly correlated with increase in kurtosis from observed signal to enhanced signal. Although soft-mask-based DNN speech enhancement has a high performance on noise reduction thanks to rich power of expression of DNN, it does not consider generation of musical noise. This paper proposes low-musical-noise speech enhancement without degrading noise-reduction-rate and generating significant speech distortion by applying kurtosis matching, which is regularization to prevent kurtosis from increasing, to DNN-based speech enhancement. We give objective evaluation of the enhanced speech signal to demonstrate the efficiency of the proposed method.
キーワード(和) 音声強調 / ミュージカルノイズ / カートシスマッチング / 深層学習
キーワード(英) speech enhancement / musical noise / kurtosis matching / deep learning
資料番号 EA2018-66,EMM2018-66
発行日 2018-11-14 (EA, EMM)

研究会情報
研究会 EA / ASJ-H / EMM / IPSJ-MUS
開催期間 2018/11/21(から2日開催)
開催地(和) ホテルこうしゅうえん(輪島市)
開催地(英) Hotel Koshuen
テーマ(和) <ビギナーズセッション>応用/電気音響,聴覚,音楽情報科学,コンテンツ処理,電子透かし,一般
テーマ(英) [Beginners Session] Engineering/Electro Acoustics, Psychological and Physiological Acoustics, Music and Computer, Content Processing, Digital Watermarking, and Related Topics
委員長氏名(和) 島内 末廣(金沢工大) / 小澤 賢司(山梨大) / 岩村 惠市(東京理科大) / 吉井 和佳(京大)
委員長氏名(英) Suehiro Shimauchi(Kanazawa Inst. of Tech.) / 小澤 賢司(山梨大) / Keiichi Iwamura(TUC) / 吉井 和佳(京大)
副委員長氏名(和) 古家 賢一(大分大) / 渡邉 貫治(秋田県立大) / 中川 誠司(千葉大) / 栗林 稔(岡山大) / 小嶋 徹也(東京高専)
副委員長氏名(英) Kenichi Furuya(Oita Univ.) / Kanji Watanabe(Akita Pref. Univ.) / 中川 誠司(千葉大) / Minoru Kuribayashi(Okayama Univ.) / Tetsuya Kojima(NIT,Tokyo College)
幹事氏名(和) 武岡 成人(静岡理工科大) / 松井 健太郎(NHK) / 山川 仁子(尚絅大) / 木谷 俊介(北陸先端大) / 大塚 翔(千葉大) / 姜 玄浩(東京高専) / 村田 晴美(中京大) / 齊藤 大輔(東大) / 竹川 佳成(はこだて未来大) / 中野 倫靖(産総研) / 松原 正樹(筑波大) / 伊藤 彰則(東北大)
幹事氏名(英) Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Kentaro Matsui(NHK) / 山川 仁子(尚絅大) / 木谷 俊介(北陸先端大) / 大塚 翔(千葉大) / Kan Hyonho(NIT, Tokyo) / Harumi Murata(Tyukyo Univ.) / 齊藤 大輔(東大) / 竹川 佳成(はこだて未来大) / 中野 倫靖(産総研) / 松原 正樹(筑波大) / 伊藤 彰則(東北大)
幹事補佐氏名(和) 井本 桂右(立命館大) / 森川 大輔(富山県立大) / / 秋山 寛子(長野高専) / 金田 北洋(キヤノン)
幹事補佐氏名(英) Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.) / / Hiroko Akiyama(NIT, Nagano College) / キタヒロ カネダ(CANON)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Auditory Research Meeting / Technical Committee on Enriched MultiMedia / Special Interest Group on Music and Computer
本文の言語 JPN
タイトル(和) カートシスマッチングに基づく低ミュージカルノイズDNN音声強調の評価
サブタイトル(和)
タイトル(英) Evaluation of DNN-based Low-Musical-Noise Speech Enhancement Using Kurtosis Matching
サブタイトル(和)
キーワード(1)(和/英) 音声強調 / speech enhancement
キーワード(2)(和/英) ミュージカルノイズ / musical noise
キーワード(3)(和/英) カートシスマッチング / kurtosis matching
キーワード(4)(和/英) 深層学習 / deep learning
第 1 著者 氏名(和/英) 溝口 聡 / Satoshi Mizoguchi
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 2 著者 氏名(和/英) 齋藤 佑樹 / Yuki Saito
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 3 著者 氏名(和/英) 高道 慎之介 / Shinnosuke Takamichi
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 4 著者 氏名(和/英) 猿渡 洋 / Hiroshi Saruwatari
第 4 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
発表年月日 2018-11-21
資料番号 EA2018-66,EMM2018-66
巻番号(vol) vol.118
号番号(no) EA-312,EMM-313
ページ範囲 pp.19-24(EA), pp.19-24(EMM),
ページ数 6
発行日 2018-11-14 (EA, EMM)