講演名 1995/10/19
ATRにおけるマルチモーダル翻訳通信研究 : マルチモーダル・ユーザ・インターフェースの実装
ローケン・キム キュンホ, 水梨 豪, 森元 逞,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 視覚情報を利用したマルチモーダル・システムでは、ユーザはコミュニケーションの手段として、画面上に表示されているオブジェクトを直接指示するジェスチャをしばしば用いる。直接指示のジェスチャは、人間同士の対話において、具体的な長い固有名の発話を指示詞などの使用によって回避させ、対話を簡略化する働きを持つ。したがって、ジェスチャは、音声認識の負荷の軽減により音声翻訳システムに好ましい影響を与えると考えられる。しかしながら、ジェスチャは多くの場合において曖昧で不完全であり、時として発話情報や文脈情報なしでは理解不能ともなり得る。われわれはこれまで、地図を用いた道案内タスクにおける直接指示のジェスチャを分類し、発話とジェスチャの関連性を分析してきた。また、その知見をもとに、マルチモーダル・インターフェースのプロトタイプの構成を紹介した。今回は、そのインターフェースの改良版について報告する。
抄録(英) In a multimodal system, because visual objects are present, users have the option of incorporating them into their communication through some form of deictic gesturing. In person to person speech, deictic gestures eliminate the need for a lengthy definite description and simplify the dialogues. It has been hypothesized therefore that they will have a favorable influence upon spoken language interpreting systems because they will reduce the speech recognition workload. Gestures are, however, in many cases, ambiguous, incomplete, and sometimes impossible to understand without verbal and contextual information. In our previous study, we classified deictic gestures used in a map-based direction finding task, and reported how verbal and gestural behaviors are interrelated. We also introduced the architecture of a prototype multimodal user interface system which was developed based on our findings. In this paper, we introduce an improved version of the multimodal user interface system.
キーワード(和) マルチモーダル・インタラクション / 音声翻訳
キーワード(英) multimodal interaction / spoken language interpretation
資料番号 SP95-64
発行日

研究会情報
研究会 SP
開催期間 1995/10/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 ENG
タイトル(和) ATRにおけるマルチモーダル翻訳通信研究 : マルチモーダル・ユーザ・インターフェースの実装
サブタイトル(和)
タイトル(英) ATR's Multimodal Interpreting Telecommunications : Implementation of Multimodal User Interface
サブタイトル(和)
キーワード(1)(和/英) マルチモーダル・インタラクション / multimodal interaction
キーワード(2)(和/英) 音声翻訳 / spoken language interpretation
第 1 著者 氏名(和/英) ローケン・キム キュンホ / Kyung-ho Loken-Kim
第 1 著者 所属(和/英) ATR音声翻訳通信研究所
ATR Interpreting Telecommunications Research Laboratories
第 2 著者 氏名(和/英) 水梨 豪 / Suguru Mizunashi
第 2 著者 所属(和/英) ATR音声翻訳通信研究所
ATR Interpreting Telecommunications Research Laboratories
第 3 著者 氏名(和/英) 森元 逞 / Tsuyoshi Morimoto
第 3 著者 所属(和/英) ATR音声翻訳通信研究所
ATR Interpreting Telecommunications Research Laboratories
発表年月日 1995/10/19
資料番号 SP95-64
巻番号(vol) vol.95
号番号(no) 318
ページ範囲 pp.-
ページ数 8
発行日