講演名 2012-12-20
高精度なマルチモーダル音声認識の実現に向けた取り組み(オーガナイズドセッション)
田村 哲嗣, 沈 鵬, 奥田 博也, 鵜飼 直弥, 河崎 卓也, 世古 拓海, 速水 悟,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,音声と口唇動画像を用いるマルチモーダル音声認識に関して,高精度・リアルタイムに駆動する手法の実現に向けた取り組みについて述べる.はじめに,画像特徴量抽出やマルチモーダル音声区間検出など,基本要素の技術的概要と現状について解説し,その技術課題を議論する.あわせて,これまでの我々の取り組みについて述べる.これらを基に,高い認識精度をもつリアルタイム・マルチモーダル音声認識のための高速化手法の検討を行い,実際にマルチモーダル音声認識システムを作成した.そこで構築したシステムについて技術的詳細を報告し,続いて考察および今後の展開について論述する.
抄録(英) Regarding Multi-Modal Automatic Speech Recognition (MMASR) which uses acoustic and lip/mouth information, this paper describes recent efforts for high-performance real-time MMASR. At first, technical overviews as well as past works for fundamental technologies in MMASR, e.g. visual feature extraction and multi-modal voice activity detection, are introduced in order to discuss their technical issues. Our related works are also summarized. According to the discussion, we investigate speed-up methods for high-performance real-time MMASR, and build an MMASR system using the methods. Details of our system are then reported, and discussion as well as future works are finally described.
キーワード(和) マルチモーダル音声認識 / リアルタイム / マルチモーダル音声区間検出
キーワード(英) Multi-modal speech recognition / real-time / multi-modal voice activity detection
資料番号 SP2012-88
発行日

研究会情報
研究会 SP
開催期間 2012/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 高精度なマルチモーダル音声認識の実現に向けた取り組み(オーガナイズドセッション)
サブタイトル(和)
タイトル(英) Recent efforts for high-performance multi-modal speech recognition
サブタイトル(和)
キーワード(1)(和/英) マルチモーダル音声認識 / Multi-modal speech recognition
キーワード(2)(和/英) リアルタイム / real-time
キーワード(3)(和/英) マルチモーダル音声区間検出 / multi-modal voice activity detection
第 1 著者 氏名(和/英) 田村 哲嗣 / Satoshi TAMURA
第 1 著者 所属(和/英) 岐阜大学工学部
Faculty of Engineering Gifu University
第 2 著者 氏名(和/英) 沈 鵬 / Peng SHEN
第 2 著者 所属(和/英) 岐阜大学大学院工学研究科
Graduate School of Engineering Gifu University
第 3 著者 氏名(和/英) 奥田 博也 / Hiroya OKUDA
第 3 著者 所属(和/英) 岐阜大学大学院工学研究科
Engineering Gifu University
第 4 著者 氏名(和/英) 鵜飼 直弥 / Naoya UKAI
第 4 著者 所属(和/英) 岐阜大学大学院工学研究科
Engineering Gifu University
第 5 著者 氏名(和/英) 河崎 卓也 / Takuya KAWASAKI
第 5 著者 所属(和/英) 岐阜大学工学部
Faculty of Engineering Gifu University
第 6 著者 氏名(和/英) 世古 拓海 / Takumi SEKO
第 6 著者 所属(和/英) 岐阜大学工学部
Faculty of Engineering Gifu University
第 7 著者 氏名(和/英) 速水 悟 / Satoru HAYAMIZU
第 7 著者 所属(和/英) 岐阜大学工学部
Faculty of Engineering Gifu University
発表年月日 2012-12-20
資料番号 SP2012-88
巻番号(vol) vol.112
号番号(no) 369
ページ範囲 pp.-
ページ数 6
発行日