講演名 2011-07-22
ネットワーク型音声対話システム開発ツール : WFSTDMビルダー(音声対話,認識,理解,対話,一般)
堀 智織, 河井 恒, 柏岡 秀紀,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々は,拡張性,移植性の高い対話制御プラットフォームとして,重み付き有限状態トランスデューサに基づく対話制御法WFSTDMを提案している.WFSTDMでは,音声言語理解WFSTを用いて認識結果からユーザの発話意図を推定し,対話シナリオWFSTを用いてユーザへの応答となるシステムアクションを決定する.本枠組みでは,音声言語理解,対話シナリオはWFSTの形式で統一的に記述され,さらに各WFSTとシステムアクションプログラムがそれぞれ独立している事から,異なるタスクのWTFSTの入れ替えや組み合わせ,さらにWFST演算を用いて各WFSTを合成する事により新たな対話システムを簡便に再構築する事ができる.本稿では,京都観光案内タスクのルールベース音声対話システムに音声対話コーパスから学習した人間対人間の対話様式を組み合わせる事により,人間対人間の対話を模した音声対話システムへと拡張した例を示す.さらに我々は,このようなWFSTDMの移植性,拡張性の高さを生かし,システム開発者が言語理解WFSTや対話シナリオWFSTを相互に利用する事により,簡便に音声対話システムを構築するプラットフォームの構築を目指している.本稿では,情報通信研究機構で構築されているネットワーク型音声対話開発ツールWFSTDMビルダーを紹介する.本対話制御プラットフォームは,開発者がネットワークを介してWFSTDMサーバで対話制御WFSTを作成し対話システムを駆動し,ユーザは対話クライアントからWFSTDMサーバにアクセスすることで音声対話を実現する.
抄録(英) We proposed WFSTDM which is an expandable and adaptable dialog management platform. The WFSTDM detects user concepts using a SLU WFST and decides a system action in response to the detected user concept using a scenario WFST. Since SLU and dialog scenario WFSTs are represented as unified description based on WFST, and scenario WFSTs and system action functions are independent, SLU and scenario WFSTs can be combined and/or composed with various combinations using WFST operations and enable us to develop new dialog management WFSTs rapidly. This paper reports an example of expandability of the WFSTDM platform through construction of a human-to-human like spoken dialog system for Kyoto tour guide system which combines a rule-based dialog system and statistical dialog scenario model trained from human-to-human dialog corpus. Additionally, this paper introduces a network-based spoken dialog system development platform: WFSTDM builder integrated by NICT. The WFSTDM builder provides functions to share and edit SLU and scenario WFSTs. Developers can create a dialog management WFST by editing and combining WFSTs in the server and run the dialog management server using their scenarios via network, and users can access to the WFSTDM server via a dialog client to realize spoken dialog.
キーワード(和) 重み付き有限状態トランスデューサ / 統計的対話制御 / WFSTDMビルター
キーワード(英) Weighted Finite-state Transducer / Statistical dialog management / WFSTDM builder
資料番号 SP2011-46
発行日

研究会情報
研究会 SP
開催期間 2011/7/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 ENG
タイトル(和) ネットワーク型音声対話システム開発ツール : WFSTDMビルダー(音声対話,認識,理解,対話,一般)
サブタイトル(和)
タイトル(英) Network-based Spoken Dialog System Development Platform : WFSTDM builder
サブタイトル(和)
キーワード(1)(和/英) 重み付き有限状態トランスデューサ / Weighted Finite-state Transducer
キーワード(2)(和/英) 統計的対話制御 / Statistical dialog management
キーワード(3)(和/英) WFSTDMビルター / WFSTDM builder
第 1 著者 氏名(和/英) 堀 智織 / Chiori Hori
第 1 著者 所属(和/英) 情報通信研究機構
NICT
第 2 著者 氏名(和/英) 河井 恒 / Hisashi Kawai
第 2 著者 所属(和/英) 情報通信研究機構
NICT
第 3 著者 氏名(和/英) 柏岡 秀紀 / Hideki Kashioka
第 3 著者 所属(和/英) 情報通信研究機構
NICT
発表年月日 2011-07-22
資料番号 SP2011-46
巻番号(vol) vol.111
号番号(no) 153
ページ範囲 pp.-
ページ数 6
発行日