講演名 2017-08-30
[ポスター講演]雑音環境下音声認識のための多チャネル非負値行列因子分解に基づく教師なしビームフォーマ
島田 一希(京大), 坂東 宜昭(京大), 三村 正人(京大), 糸山 克寿(京大), 吉井 和佳(京大), 河原 達也(京大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,雑音環境下音声認識のための教師なし多チャネル音声強調について述べる.音声認識における多チャネル音声強調ではビームフォーマが一般的であり,その構成要素であるステアリングベクトルや空間相関行列の推定はDNNを用いて作成したマスクに基づく手法が主流になっている.このような教師あり手法は訓練データに過学習し未知環境において性能が低下するおそれがある.そこで本研究では,多チャネル非負値行列因子分解(MNMF)に基づくブラインド音源分離を用いて空間相関行列を推定する教師なしビームフォーマを提案する.MVDRビームフォーマ及び目的音声のスケールを考慮するMAP推定に基づくビームフォーマにおいて,時変及び時不変フィルタに加えて,発話内で変化しないステアリングベクトルと時間フレームごとに変わる雑音の空間相関行列によるフィルタを構築した.実録音データに対する音声認識実験を行った結果,提案法が未知環境においてDNNマスクに基づくビームフォーマより頑健に動作することを示した.また時不変な目的音声のステアリングベクトル及び時変な雑音の空間相関行列をMNMFにより推定したMAPビームフォーマが最も高い性能を示した.
抄録(英)
キーワード(和) 雑音環境下音声認識 / 音声強調 / ビームフォーミング / 多チャネル非負値行列因子分解
キーワード(英) noisy speech recognition / speech enhancement / beamforming / multichannel nonnegative matrix factrization
資料番号 SP2017-23
発行日 2017-08-23 (SP)

研究会情報
研究会 SP
開催期間 2017/8/30(から1日開催)
開催地(和) 京都大学
開催地(英) Kyoto Univ.
テーマ(和) 音の認知,学習,信号処理,音声一般
テーマ(英)
委員長氏名(和) 山下 洋一(立命館大)
委員長氏名(英) Yoichi Yamashita(Ritsumeikan Univ.)
副委員長氏名(和) 森 大毅(宇都宮大)
副委員長氏名(英) Hiroki Mori(Utsunomiya Univ.)
幹事氏名(和) 西田 昌史(静岡大) / 坂野 秀樹(名城大)
幹事氏名(英) Masafumi Nishida(Shizuoka Univ.) / Hideki Banno(Meijo Univ.)
幹事補佐氏名(和) 橋本 佳(名工大) / 小橋川 哲(NTT)
幹事補佐氏名(英) Kei Hashimoto(Nagoya Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Speech
本文の言語 JPN-ONLY
タイトル(和) [ポスター講演]雑音環境下音声認識のための多チャネル非負値行列因子分解に基づく教師なしビームフォーマ
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 雑音環境下音声認識 / noisy speech recognition
キーワード(2)(和/英) 音声強調 / speech enhancement
キーワード(3)(和/英) ビームフォーミング / beamforming
キーワード(4)(和/英) 多チャネル非負値行列因子分解 / multichannel nonnegative matrix factrization
第 1 著者 氏名(和/英) 島田 一希 / Kazuki Shimada
第 1 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 2 著者 氏名(和/英) 坂東 宜昭 / Yoshiaki Bando
第 2 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 3 著者 氏名(和/英) 三村 正人 / Masato Mimura
第 3 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 4 著者 氏名(和/英) 糸山 克寿 / Katsutoshi Itoyama
第 4 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 5 著者 氏名(和/英) 吉井 和佳 / Kazuyoshi Yoshii
第 5 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 6 著者 氏名(和/英) 河原 達也 / Tatsuya Kawahara
第 6 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
発表年月日 2017-08-30
資料番号 SP2017-23
巻番号(vol) vol.117
号番号(no) SP-189
ページ範囲 pp.19-24(SP),
ページ数 6
発行日 2017-08-23 (SP)