講演名 1994/9/3
HMM音声認識における視聴覚融合手法
新谷 輝, 荻原 昭夫, 福永 邦雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 対話相手の発話内容を認識する際,人間は音声信号の聴覚情報とともに発話時の口の動きである映像信号を視覚情報として捉えている.この事実に基づき,本報告では視覚情報と聴覚情報を融合してHMMにより音声認識を行なう.聴覚情報と視覚情報をそれぞれ独立したHMMにより処理を施した後,一次結合によりこれらの視聴覚情報を融合する手法とニューラルネットワークにより視聴覚情報を融合する手法を提案し,単語音声認識実験により本手法の有効性を確認した.
抄録(英) We propose two methods to fuse auditory information and visual information for accurate speech recognition.The first method fuses two kinds of information by using linear combination after calculating two kinds of probabilities by HMM for each word.The second method fuses two kinds of information by using neural network.We have performed speech recognition experiments of isolated words using the proposed methods and confirmed the validity of the proposed methods.
キーワード(和) 音声認識 / 視聴覚融合 / HMM / ニューラルネットワーク
キーワード(英) speech recognition / fusion of visual and auditory / HMM / neural network
資料番号 CAS94-54
発行日

研究会情報
研究会 CAS
開催期間 1994/9/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Circuits and Systems (CAS)
本文の言語 JPN
タイトル(和) HMM音声認識における視聴覚融合手法
サブタイトル(和)
タイトル(英) Fusion Methods of Visual and Auditory Information in Speech Recognition Using HMM
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / speech recognition
キーワード(2)(和/英) 視聴覚融合 / fusion of visual and auditory
キーワード(3)(和/英) HMM / HMM
キーワード(4)(和/英) ニューラルネットワーク / neural network
第 1 著者 氏名(和/英) 新谷 輝 / Akira Shintani
第 1 著者 所属(和/英) 大阪府立大学工学部
College of Engineering,University of Osaka Prefecture
第 2 著者 氏名(和/英) 荻原 昭夫 / Akio Ogihara
第 2 著者 所属(和/英) 大阪府立大学工学部
College of Engineering,University of Osaka Prefecture
第 3 著者 氏名(和/英) 福永 邦雄 / Kunio Fukunaga
第 3 著者 所属(和/英) 大阪府立大学工学部
College of Engineering,University of Osaka Prefecture
発表年月日 1994/9/3
資料番号 CAS94-54
巻番号(vol) vol.94
号番号(no) 214
ページ範囲 pp.-
ページ数 8
発行日