講演名 1996/6/14
音声利用効果の経時変化と顔向認識による不要発話の棄却 : マルチモーダル作図システムS-tgifにおける評価
西本 卓也, 志田 修利, 小林 隆, 春山 智, 小林 哲則,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) インタフェースの原則論に基づいて音声入力とマウス,キーボードとの協調のあり方を考慮しつつ設計・作成された音声作図システムS-tgifを用いて,システムの利用経験に伴う音声利用効果の変化を調べた.本システムを利用し始めて間もない時期においては,音声を利用することで操作時間を減じることができ,作業効率の改善がみられた.システムの利用に熟練するとユーザは他のより効率的な入力手段の利用に慣れ,音声利用の効果は薄れたが,特定のコマンドでは音声の利用率が常に90%を越え,音声の利用はユーザから支持された.さらに,システムの利用を中断すると再び音声利用の効果が上がることを確認した.また,S-tgifに音声の音響的特徴と顔向認識を用いた非コマンド語発話のリジェクション機能を付加した.システムの簡単な評価を試みたところ棄却機能は有効に機能し,音声・顔画像情報を協調的に利用しうることがわかった.
抄録(英) Using multimodal drawing system S-tgif, we observed the changes of speech input effect when the users gain experiences on the system. Inexperienced user completed tasks with less time using speech input. Although experienced users tend to use more mouse and key-board, speech input was frequently used for some kind of commands. If they stopped using the system for two months and used it again the effectiveness of speech input increased again. The system has a fault that it sometimes respond to non-command utterances and cause incorrect actions. To solve this problem, we extended the system by introducing face direction recognition based on image processing as well as command/non-command recognition using supra-segmental feature of speech. We also discuss the implementation of the new system and the current performance.
キーワード(和) マルチ・モーダル・インタフェース / 音声認識 / 顔向認識 / 非コマンド発話棄却
キーワード(英) Multi-Modal Interface / Speech Recognition / Face Direction Recognition / Non-command Word Rejection
資料番号 SP96-32
発行日

研究会情報
研究会 SP
開催期間 1996/6/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 音声利用効果の経時変化と顔向認識による不要発話の棄却 : マルチモーダル作図システムS-tgifにおける評価
サブタイトル(和)
タイトル(英) The Effect of Users' Experiences on Speech Input System and Non-Command Word Rejection Using Face Image
サブタイトル(和)
キーワード(1)(和/英) マルチ・モーダル・インタフェース / Multi-Modal Interface
キーワード(2)(和/英) 音声認識 / Speech Recognition
キーワード(3)(和/英) 顔向認識 / Face Direction Recognition
キーワード(4)(和/英) 非コマンド発話棄却 / Non-command Word Rejection
第 1 著者 氏名(和/英) 西本 卓也 / Takuya NISHIMOTO
第 1 著者 所属(和/英) 京都工芸繊維大学工芸学部電子情報工学科
Department of Electronics and Information Science, Kyoto Institute of Technology
第 2 著者 氏名(和/英) 志田 修利 / Nobutoshi SHIDA
第 2 著者 所属(和/英) 早稲田大学理工学部電気電子情報工学科
Department of Electrical, Electronics and Computer Engineering, Waseda University
第 3 著者 氏名(和/英) 小林 隆 / Takashi KOBAYASHI
第 3 著者 所属(和/英) 早稲田大学理工学部電気電子情報工学科
Department of Electrical, Electronics and Computer Engineering, Waseda University
第 4 著者 氏名(和/英) 春山 智 / Satoshi HARUYAMA
第 4 著者 所属(和/英) 早稲田大学理工学部電気電子情報工学科
Department of Electrical, Electronics and Computer Engineering, Waseda University
第 5 著者 氏名(和/英) 小林 哲則 / Tetsunori KOBAYASHI
第 5 著者 所属(和/英) 早稲田大学理工学部電気電子情報工学科
Department of Electrical, Electronics and Computer Engineering, Waseda University
発表年月日 1996/6/14
資料番号 SP96-32
巻番号(vol) vol.96
号番号(no) 93
ページ範囲 pp.-
ページ数 8
発行日