講演名 2017-08-30
[ポスター講演]再帰型ニューラルネットワークを用いたセミブラインド音声分離・強調
和気 雅弥(京大), 坂東 宜昭(京大), 三村 正人(京大), 糸山 克寿(京大), 吉井 和佳(京大), 河原 達也(京大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,ニューラルネットワークを用いたセミブラインド音声強調の手法について述べる.人間とロボットとの対話において,ロボットは自身のマイクロホンに加えて,ロボット自身の発話信号も得ることができるため,ここで扱う音声強調はセミブラインドである.本稿では,セミブラインド音源分離とブラインド残響除去の2つのモジュールからなるニューラルネットワークを提案する.この再帰型ニューラルネットワークは,両モジュールに教師信号を用いることでマルチタスク学習を行う.評価実験により,既存のセミブラインド音声強調法と比べて提案手法の有効性を示す.
抄録(英) This paper describes a semi-blind speech enhancement method using a neural network. In a human-robot speech interaction, the robot inputs not only audio signals recorded by a microphone but also speech signals made by the robot itself, which can be used for semi-blind speech enhancement. We propose a neural network which consists of cascaded two modules: a semi-blind source separation module and a blind dereverberation module. The proposed recurrent neural network is trained in a manner of multi-task learning, i.e., teacher signals are used for both the output of the separation module and the dereverberation module. Experiments are conducted to show the effectiveness of the proposed network.
キーワード(和) セミブラインド音声強調 / セミブラインド音声分離 / ブラインド残響除去 / 再帰型ニューラルネットワーク
キーワード(英) Semi-blind speech enhancement / Semi-blind source separation / Blind dereverberation / Recurrent neural network
資料番号 SP2017-22
発行日 2017-08-23 (SP)

研究会情報
研究会 SP
開催期間 2017/8/30(から1日開催)
開催地(和) 京都大学
開催地(英) Kyoto Univ.
テーマ(和) 音の認知,学習,信号処理,音声一般
テーマ(英)
委員長氏名(和) 山下 洋一(立命館大)
委員長氏名(英) Yoichi Yamashita(Ritsumeikan Univ.)
副委員長氏名(和) 森 大毅(宇都宮大)
副委員長氏名(英) Hiroki Mori(Utsunomiya Univ.)
幹事氏名(和) 西田 昌史(静岡大) / 坂野 秀樹(名城大)
幹事氏名(英) Masafumi Nishida(Shizuoka Univ.) / Hideki Banno(Meijo Univ.)
幹事補佐氏名(和) 橋本 佳(名工大) / 小橋川 哲(NTT)
幹事補佐氏名(英) Kei Hashimoto(Nagoya Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Speech
本文の言語 JPN
タイトル(和) [ポスター講演]再帰型ニューラルネットワークを用いたセミブラインド音声分離・強調
サブタイトル(和)
タイトル(英) [Poster Presentation] Semi-blind speech separation and enhancement using recurrent neural network
サブタイトル(和)
キーワード(1)(和/英) セミブラインド音声強調 / Semi-blind speech enhancement
キーワード(2)(和/英) セミブラインド音声分離 / Semi-blind source separation
キーワード(3)(和/英) ブラインド残響除去 / Blind dereverberation
キーワード(4)(和/英) 再帰型ニューラルネットワーク / Recurrent neural network
第 1 著者 氏名(和/英) 和気 雅弥 / Masaya Wake
第 1 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 2 著者 氏名(和/英) 坂東 宜昭 / Yoshiaki Bando
第 2 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 3 著者 氏名(和/英) 三村 正人 / Masato Mimura
第 3 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 4 著者 氏名(和/英) 糸山 克寿 / Katsutoshi Itoyama
第 4 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 5 著者 氏名(和/英) 吉井 和佳 / Kazuyoshi Yoshii
第 5 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 6 著者 氏名(和/英) 河原 達也 / Tatsuya Kawahara
第 6 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
発表年月日 2017-08-30
資料番号 SP2017-22
巻番号(vol) vol.117
号番号(no) SP-189
ページ範囲 pp.13-18(SP),
ページ数 6
発行日 2017-08-23 (SP)