距離画像を用いたマルチモーダル音声認識

鵜飼,直弥; 田村,哲嗣; 速水,悟

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2014-03-14 10:45 距離画像を用いたマルチモーダル音声認識 ○鵜飼直弥・田村哲嗣・速水　悟（岐阜大） PRMU2013-198
抄録	（和）	本稿では，マルチモーダル音声認識の新モダリティとして距離画像を提案する．特徴量として固有口を利用し，HMM とマルチストリームHMM を用いて，距離画像単体での読唇実験と，音声情報と統合しマルチモーダル音声認識実験を行った．その結果として，距離画像による認識性能とマルチモーダル音声認識実験による雑音環境下での認識率改善を確認することができ，距離画像の有効性が見られた．
	（英）	This paper presents a novel framework which uses depth information of human face and mouth movements as yet another modality for audio-visual speech recognition. We propose features of "eigenlip" by principal component analysis of depth maps in order to make them more robust for the sensor noise. We conducted experiments of digit speech recognition by incorporating audio information with depth maps of facial 3D shape in the multi-stream HMM (hidden Markov model). By comparing recognition of only depth with audio-depth information, we show improvement of accuracy in noisy environment.
キーワード	（和）	マルチモーダル音声認識 / 距離画像 / Kinect / 固有口 / / / /
	（英）	Audio-visual speech recognition / Depth image / Kinect / Eigenlip / / / /
文献情報		信学技報, vol. 113, no. 493, PRMU2013-198, pp. 179-184, 2014年3月.
資料番号		PRMU2013-198
発行日		2014-03-06 (PRMU)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		PRMU2013-198

研究会情報
研究会	PRMU
開催期間	2014-03-13 - 2014-03-14
開催地（和）	早稲田大学
開催地（英）
テーマ（和）	パターン認識・メディア理解における組み合わせと統合，文化の振興と教育
テーマ（英）
講演論文情報の詳細
申込み研究会	PRMU
会議コード	2014-03-PRMU
本文の言語	日本語
タイトル（和）	距離画像を用いたマルチモーダル音声認識
サブタイトル（和）
タイトル（英）	A study on multi-modal speech recognition using depth images
サブタイトル（英）
キーワード(1)（和/英）	マルチモーダル音声認識 / Audio-visual speech recognition
キーワード(2)（和/英）	距離画像 / Depth image
キーワード(3)（和/英）	Kinect / Kinect
キーワード(4)（和/英）	固有口 / Eigenlip
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	鵜飼直弥 / Naoya Ukai / ウカイナオヤ
第1著者所属（和/英）	岐阜大学 (略称：岐阜大) Gifu University (略称： Gifu Univ.)
第2著者氏名（和/英/ヨミ）	田村哲嗣 / Satoshi Tamura / タムラサトシ
第2著者所属（和/英）	岐阜大学 (略称：岐阜大) Gifu University (略称： Gifu Univ.)
第3著者氏名（和/英/ヨミ）	速水悟 / Satoru Hayamizu / ハヤミズサトル
第3著者所属（和/英）	岐阜大学 (略称：岐阜大) Gifu University (略称： Gifu Univ.)
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2014-03-14 10:45:00
発表時間	30分
申込先研究会	PRMU
資料番号	PRMU2013-198
巻番号（vol）	vol.113
号番号（no）	no.493
ページ範囲	pp.179-184
ページ数	6
発行日	2014-03-06 (PRMU)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会