講演名 2006/12/15
ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(Session-7 システム,第8回音声言語シンポジウム)
翠 輝久, 河原 達也,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声対話システムにおいて,ユーザの多様な発話を頑健に認識するためには,タスクドメインに合致した十分な量のテキストデータでN-gram言語モデルを学習することが望ましい.しかし,新たに音声対話システムを作成する際に,ユーザが入力すると想定される発話を大量に用意することは困難である.そこで本研究では,Webから学習データを収集・選択することにより効率的に言語モデルを構築する手法を提案する.Webの検索クエリは,対話システムが対象とするドメインについて記述された文書から作成して,Webを検索する.このようにして収集されたWebテキストの多くは,対話システムのユーザの発話スタイルとマッチしたものではなく,言語モデルの学習データとしてこれらのすべてを使用するのは適切でない.そこで,別の対話システムで収集されたユーザ発話コーパスを併用することで,発話スタイルの近い文を選択する.ソフトウェアサポートと観光案内の2つのドメインにおいて評価を行った結果,音声認識精度の有意な改善が得られた.また実験結果の分析により,Webテキストを選択する際に,テキストのスタイルを考慮することの重要性が確認された.
抄録(英) This paper proposes a bootstrapping method of constructing statistical language models for new spoken dialog systems by collecting and selecting sentences from the World Wide Web (WWW). To make effective search queries that cover the target domain in full detail, we exploit the document set described about the target domain as seeding data. An important issue is how to filter the retrieved Web pages, since all of the retrieved Web texts are not necessarily suitable as training data. We induct an existing dialog corpus of different domain to prefer the texts of spoken style. The proposed method was evaluated on two different tasks of software support and sightseeing guidance, and significant reduction of the word error rate was achieved. We show that it is vital to incorporate the dialog corpus, though not relevant to the target domain, in the text selection phase.
キーワード(和) 音声認識 / 言語モデル / 音声対話システム / Webテキスト選択
キーワード(英) Speech recognition / Language model / Spoken dialog system / Web text selection
資料番号 NLC2006-70,SP2006-126
発行日

研究会情報
研究会 SP
開催期間 2006/12/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(Session-7 システム,第8回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Efficient Language Model Construction for Spoken Dialog Systems by Web Text Selection Considering Domain and Utterance Style
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / Speech recognition
キーワード(2)(和/英) 言語モデル / Language model
キーワード(3)(和/英) 音声対話システム / Spoken dialog system
キーワード(4)(和/英) Webテキスト選択 / Web text selection
第 1 著者 氏名(和/英) 翠 輝久 / Teruhisa MISU
第 1 著者 所属(和/英) 京都大学 知能情報学専攻
School of Informatics, Kyoto University
第 2 著者 氏名(和/英) 河原 達也 / Tatsuya KAWAHARA
第 2 著者 所属(和/英) 京都大学 知能情報学専攻
School of Informatics, Kyoto University
発表年月日 2006/12/15
資料番号 NLC2006-70,SP2006-126
巻番号(vol) vol.106
号番号(no) 444
ページ範囲 pp.-
ページ数 6
発行日