電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2018-03-19 11:15
マルチチャネル非負値行列因子分解に基づくビームフォーミングを用いた雑音環境下音声認識
島田一希坂東宜昭三村正人糸山克寿吉井和佳河原達也京大
技報オンラインサービス実施中
抄録 (和) 本稿では,雑音に頑健な音声認識のためのマルチチャネル音声強調について述べる.音声認識のための音声強調では,マイクロホンアレイにより観測したマルチチャネル信号から,目的音声方向の信号を強調し雑音方向の信号を除去するビームフォーミングが効果的である.ビームフォーミングを行うために必要な目的音声の方向を表すステアリングベクトルや雑音の空間相関行列の推定については,時間周波数マスクに基づく手法が活発に研究されており,時間周波数ビンを目的音声と雑音に分類するディープニューラルネットワーク(DNN)を用いてマスクを推定する手法が高い性能を示すことが知られている.このような事前の教師あり学習による手法は,未知環境において性能が低下するおそれがある.そこで本研究では,教師なしで空間相関行列を正確に推定するために,マルチチャネル非負値行列因子分解(MNMF)に基づくブラインド音源分離を用いて,観測の各時間周波数ビンを目的音声とそれ以外の音源(雑音)に分解する手法を提案する.本研究ではMNMFをオンライン処理に拡張し,音声強調に適した初期化を行う.MNMFに適したビームフォーミングを明らかにするために,最小分散無歪(MVDR)ビームフォーミング及びマルチチャネルウィーナーフィルタリング(MWF)において,時変及び時不変フィルタの両方を比較した.実録音データに対する音声認識実験を行い,提案法が未知環境においてDNNマスクに基づくビームフォーミングと比べて頑健に動作することを示した. 
(英) (Available after conference date)
キーワード (和) 雑音環境下音声認識 / 音声強調 / ビームフォーミング / マルチチャネル非負値行列因子分解 / / / /  
(英) / / / / / / /  
文献情報 信学技報, vol. 117, no. 517, SP2017-90, pp. 33-38, 2018年3月.
資料番号 SP2017-90 
発行日 2018-03-12 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 SIP EA SP MI  
開催期間 2018-03-19 - 2018-03-20 
開催地(和) 石垣島 ホテルミヤヒラ 
開催地(英)  
テーマ(和) 音声,応用/電気音響,信号処理,一般 [SIP,EA,SP]/ 医用画像工学一般 [MI] 
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics [SIP, EA, SP]/ Medical Image Engineering, Analysis, Recognition, etc. [MI] 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2018-03-SIP-EA-SP-MI 
本文の言語 日本語(英語タイトルなし) 
タイトル(和) マルチチャネル非負値行列因子分解に基づくビームフォーミングを用いた雑音環境下音声認識 
サブタイトル(和)  
タイトル(英)  
サブタイトル(英)  
キーワード(1)(和/英) 雑音環境下音声認識 /  
キーワード(2)(和/英) 音声強調 /  
キーワード(3)(和/英) ビームフォーミング /  
キーワード(4)(和/英) マルチチャネル非負値行列因子分解 /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 島田 一希 / Kazuki Shimada / シマダ カズキ
第1著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第2著者 氏名(和/英/ヨミ) 坂東 宜昭 / Yoshiaki Bando / バンドウ ヨシアキ
第2著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第3著者 氏名(和/英/ヨミ) 三村 正人 / Masato Mimura / ミムラ マサト
第3著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第4著者 氏名(和/英/ヨミ) 糸山 克寿 / Katsutoshi Itoyama / イトヤマ カツトシ
第4著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第5著者 氏名(和/英/ヨミ) 吉井 和佳 / Kazuyoshi Yoshii / ヨシイ カズヨシ
第5著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第6著者 氏名(和/英/ヨミ) 河原 達也 / Tatsuya Kawahara / カワハラ タツヤ
第6著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2018-03-19 11:15:00 
発表時間 25 
申込先研究会 SP 
資料番号 IEICE-EA2017-107,IEICE-SIP2017-116,IEICE-SP2017-90 
巻番号(vol) IEICE-117 
号番号(no) no.515(EA), no.516(SIP), no.517(SP) 
ページ範囲 pp.33-38 
ページ数 IEICE-6 
発行日 IEICE-EA-2018-03-12,IEICE-SIP-2018-03-12,IEICE-SP-2018-03-12 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会