［ポスター講演］再帰型ニューラルネットワークを用いたセミブラインド音声分離・強調

和気 雅弥; 坂東 宜昭; 三村 正人; 糸山 克寿; 吉井 和佳; 河原 達也

講演名	2017-08-30 ［ポスター講演］再帰型ニューラルネットワークを用いたセミブラインド音声分離・強調和気雅弥(京大), 坂東宜昭(京大), 三村正人(京大), 糸山克寿(京大), 吉井和佳(京大), 河原達也(京大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本稿では，ニューラルネットワークを用いたセミブラインド音声強調の手法について述べる．人間とロボットとの対話において，ロボットは自身のマイクロホンに加えて，ロボット自身の発話信号も得ることができるため，ここで扱う音声強調はセミブラインドである．本稿では，セミブラインド音源分離とブラインド残響除去の2つのモジュールからなるニューラルネットワークを提案する．この再帰型ニューラルネットワークは，両モジュールに教師信号を用いることでマルチタスク学習を行う．評価実験により，既存のセミブラインド音声強調法と比べて提案手法の有効性を示す．
抄録(英)	This paper describes a semi-blind speech enhancement method using a neural network. In a human-robot speech interaction, the robot inputs not only audio signals recorded by a microphone but also speech signals made by the robot itself, which can be used for semi-blind speech enhancement. We propose a neural network which consists of cascaded two modules: a semi-blind source separation module and a blind dereverberation module. The proposed recurrent neural network is trained in a manner of multi-task learning, i.e., teacher signals are used for both the output of the separation module and the dereverberation module. Experiments are conducted to show the effectiveness of the proposed network.
キーワード(和)	セミブラインド音声強調 / セミブラインド音声分離 / ブラインド残響除去 / 再帰型ニューラルネットワーク
キーワード(英)	Semi-blind speech enhancement / Semi-blind source separation / Blind dereverberation / Recurrent neural network
資料番号	SP2017-22
発行日	2017-08-23 (SP)

研究会情報
研究会	SP
開催期間	2017/8/30(から1日開催)
開催地（和）	京都大学
開催地（英）	Kyoto Univ.
テーマ（和）	音の認知，学習，信号処理，音声一般
テーマ（英）
委員長氏名（和）	山下洋一(立命館大)
委員長氏名（英）	Yoichi Yamashita(Ritsumeikan Univ.)
副委員長氏名（和）	森大毅(宇都宮大)
副委員長氏名（英）	Hiroki Mori(Utsunomiya Univ.)
幹事氏名（和）	西田昌史(静岡大) / 坂野秀樹(名城大)
幹事氏名（英）	Masafumi Nishida(Shizuoka Univ.) / Hideki Banno(Meijo Univ.)
幹事補佐氏名（和）	橋本佳(名工大) / 小橋川哲(NTT)
幹事補佐氏名（英）	Kei Hashimoto(Nagoya Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会	Technical Committee on Speech
本文の言語	JPN
タイトル（和）	［ポスター講演］再帰型ニューラルネットワークを用いたセミブラインド音声分離・強調
サブタイトル（和）
タイトル（英）	[Poster Presentation] Semi-blind speech separation and enhancement using recurrent neural network
サブタイトル（和）
キーワード(1)（和/英）	セミブラインド音声強調 / Semi-blind speech enhancement
キーワード(2)（和/英）	セミブラインド音声分離 / Semi-blind source separation
キーワード(3)（和/英）	ブラインド残響除去 / Blind dereverberation
キーワード(4)（和/英）	再帰型ニューラルネットワーク / Recurrent neural network
第 1 著者氏名（和/英）	和気雅弥 / Masaya Wake
第 1 著者所属（和/英）	京都大学(略称：京大) Kyoto University(略称：Kyoto Univ.)
第 2 著者氏名（和/英）	坂東宜昭 / Yoshiaki Bando
第 2 著者所属（和/英）	京都大学(略称：京大) Kyoto University(略称：Kyoto Univ.)
第 3 著者氏名（和/英）	三村正人 / Masato Mimura
第 3 著者所属（和/英）	京都大学(略称：京大) Kyoto University(略称：Kyoto Univ.)
第 4 著者氏名（和/英）	糸山克寿 / Katsutoshi Itoyama
第 4 著者所属（和/英）	京都大学(略称：京大) Kyoto University(略称：Kyoto Univ.)
第 5 著者氏名（和/英）	吉井和佳 / Kazuyoshi Yoshii
第 5 著者所属（和/英）	京都大学(略称：京大) Kyoto University(略称：Kyoto Univ.)
第 6 著者氏名（和/英）	河原達也 / Tatsuya Kawahara
第 6 著者所属（和/英）	京都大学(略称：京大) Kyoto University(略称：Kyoto Univ.)
発表年月日	2017-08-30
資料番号	SP2017-22
巻番号（vol）	vol.117
号番号（no）	SP-189
ページ範囲	pp.13-18(SP),
ページ数	6
発行日	2017-08-23 (SP)