講演名 2018-11-21
交互学習と多層化によるニューラルネットワークビームフォーマの音声歪み低減の検討
江口 航平(九工大), 水町 光徳(九工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ニューラルネットワークビームフォーマは,目的方向と非目的方向の同時制御が可能であるため,線形演算による遅延和ビームフォーマと比較して雑音抑圧性能が高い.一般に,非線形活性化関数を用いるニューラルネットワークビームフォーマは,出力信号に非線形歪みが生じる.著者らは,この非線形歪みを低減するために,従来の指向特性に基づくコスト関数に加えて,新たにスペクトル歪みに基づくコスト関数を導入し,それらを交互に用いてネットワークの学習を行うビームフォーマを提案した.交互学習ビームフォーマは, 信号対雑音比とスペクトル歪みの両評価尺度において,従来のニューラルネットワークビームフォーマに対する優位性は小さかった。本稿では,交互学習ビームフォーマのネットワーク層数を3層から4層,5層へと変化させた場合,またネットワークの学習方法を変更した場合の性能について検討した。その結果, 信号対雑音比とスペクトル歪みの両評価尺度において,ネットワーク層数は5層が最も望ましいことがわかった。また,学習方法に関しては,コスト関数を用いる順序と学習回数の関係について更なる検討が必要であることがわかった.
抄録(英) A neural network-based beamformer can simultaneously optimize its beam-pattern at the desired and undesired directions so that it enables noise reduction more efficiently compared with a conventional delay-and-sum beamformer with the linear signal processing. In general, the neural network-based beamformer causes the annoying non-linear distortion on the output signal due to the non-linear activation functions. The authors previously proposed a distortion-less neural network-based beamformer with the dual cost functions based on the directivity and spectral distortion. The beamformer was alternatively trained with either the directivity-based or spectral distortion-based cost functions. The proposed beamformer was slightly superior to the conventional non-linear beamformer in the viewpoints of the signal-to-noise ration and spectral distortion. In this paper, the number of the network layers is increased from three to four and five, and the training scheme is reconsidered in training the neural network. It is found that the neural network-based beamformer with five layers achieves the highest performance. Concerning the training scheme, it is necessary to carefully investigate the relationship between the training order with the dual cost functions and the number of iteration.
キーワード(和) 交互学習 / ビームフォーマ / ニューラルネットワーク / 非線形歪み
キーワード(英) Alternative training / Beamformer / Neural network / Non-linear distortion
資料番号 EA2018-64,EMM2018-64
発行日 2018-11-14 (EA, EMM)

研究会情報
研究会 EA / ASJ-H / EMM / IPSJ-MUS
開催期間 2018/11/21(から2日開催)
開催地(和) ホテルこうしゅうえん(輪島市)
開催地(英) Hotel Koshuen
テーマ(和) <ビギナーズセッション>応用/電気音響,聴覚,音楽情報科学,コンテンツ処理,電子透かし,一般
テーマ(英) [Beginners Session] Engineering/Electro Acoustics, Psychological and Physiological Acoustics, Music and Computer, Content Processing, Digital Watermarking, and Related Topics
委員長氏名(和) 島内 末廣(金沢工大) / 小澤 賢司(山梨大) / 岩村 惠市(東京理科大) / 吉井 和佳(京大)
委員長氏名(英) Suehiro Shimauchi(Kanazawa Inst. of Tech.) / 小澤 賢司(山梨大) / Keiichi Iwamura(TUC) / 吉井 和佳(京大)
副委員長氏名(和) 古家 賢一(大分大) / 渡邉 貫治(秋田県立大) / 中川 誠司(千葉大) / 栗林 稔(岡山大) / 小嶋 徹也(東京高専)
副委員長氏名(英) Kenichi Furuya(Oita Univ.) / Kanji Watanabe(Akita Pref. Univ.) / 中川 誠司(千葉大) / Minoru Kuribayashi(Okayama Univ.) / Tetsuya Kojima(NIT,Tokyo College)
幹事氏名(和) 武岡 成人(静岡理工科大) / 松井 健太郎(NHK) / 山川 仁子(尚絅大) / 木谷 俊介(北陸先端大) / 大塚 翔(千葉大) / 姜 玄浩(東京高専) / 村田 晴美(中京大) / 齊藤 大輔(東大) / 竹川 佳成(はこだて未来大) / 中野 倫靖(産総研) / 松原 正樹(筑波大) / 伊藤 彰則(東北大)
幹事氏名(英) Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Kentaro Matsui(NHK) / 山川 仁子(尚絅大) / 木谷 俊介(北陸先端大) / 大塚 翔(千葉大) / Kan Hyonho(NIT, Tokyo) / Harumi Murata(Tyukyo Univ.) / 齊藤 大輔(東大) / 竹川 佳成(はこだて未来大) / 中野 倫靖(産総研) / 松原 正樹(筑波大) / 伊藤 彰則(東北大)
幹事補佐氏名(和) 井本 桂右(立命館大) / 森川 大輔(富山県立大) / / 秋山 寛子(長野高専) / 金田 北洋(キヤノン)
幹事補佐氏名(英) Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.) / / Hiroko Akiyama(NIT, Nagano College) / キタヒロ カネダ(CANON)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Auditory Research Meeting / Technical Committee on Enriched MultiMedia / Special Interest Group on Music and Computer
本文の言語 JPN
タイトル(和) 交互学習と多層化によるニューラルネットワークビームフォーマの音声歪み低減の検討
サブタイトル(和)
タイトル(英) Improvement of speech distortion caused by multi-layered neural network-based beamformer with alternative training
サブタイトル(和)
キーワード(1)(和/英) 交互学習 / Alternative training
キーワード(2)(和/英) ビームフォーマ / Beamformer
キーワード(3)(和/英) ニューラルネットワーク / Neural network
キーワード(4)(和/英) 非線形歪み / Non-linear distortion
第 1 著者 氏名(和/英) 江口 航平 / Kouhei Eguchi
第 1 著者 所属(和/英) 九州工業大学(略称:九工大)
Kyushu Institute of Technology(略称:KIT)
第 2 著者 氏名(和/英) 水町 光徳 / Mitsunori Mizumachi
第 2 著者 所属(和/英) 九州工業大学(略称:九工大)
Kyushu Institute of Technology(略称:KIT)
発表年月日 2018-11-21
資料番号 EA2018-64,EMM2018-64
巻番号(vol) vol.118
号番号(no) EA-312,EMM-313
ページ範囲 pp.7-12(EA), pp.7-12(EMM),
ページ数 6
発行日 2018-11-14 (EA, EMM)