講演名 2002/1/18
キーワードスポッティングを用いた情報検索システムにおける拡張辞書の効果
山本 哲也, 緒方 淳, 有木 康雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声入力により放送ニュースに対して情報検索を行うシステムについて検討している.その前処理として, 比較的自由度の高いユーザの問い合わせに対して, 頑健な音声認識が可能なシステムを目指している.ユーザの語彙辞書の作成方法としてニュース音声の書き起こし結果を利用している.本研究では, まず学習データと評価データの時期差の問題を解決するために, 最新のWebのニュース記事からN-gram言語モデルを作成し, 評価データに適応した.また未知語を補う方法として情報検索で広く使われている単純類似度法やLSI法を用いて検討した.これにより, 未知語に対して若干の効果を確認することができた.次に, キーワードスポッティングのシミュレーション実験を行い, システムの有効性を示した.
抄録(英) An information retrieval system by voice input for broadcast news is investigated. Our purpose is to design the system in which robust speech recognition is possible to inquiries from a user with comparatively high flexibility. The transcription result of a news speech is used to contruct a user's keyword dictionary for inquiry. In order to solve a problem of time difference between training data and evaluation data, the N-gram language model was created from the news story in the newest Web data, and it was adapted to evaluation data. In addition, widely used vector space model and LSI method were investigated to deal with the words out of vocabulary. Through the experiments, some effect was verified. The simulation experiment of keyword potting was conducted and the system validity was shown.
キーワード(和) Webニュース記事 / N-gram言語モデル / LSI法 / 拡張辞書 / キーワードスポッティング
キーワード(英) web news / N-gram language model / LSI method / expanded dictionary / keyword spotting
資料番号
発行日

研究会情報
研究会 SP
開催期間 2002/1/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) キーワードスポッティングを用いた情報検索システムにおける拡張辞書の効果
サブタイトル(和)
タイトル(英) Effectiveness of An Expanded Dictionary in Information Retrieval System by Keyword Spotting
サブタイトル(和)
キーワード(1)(和/英) Webニュース記事 / web news
キーワード(2)(和/英) N-gram言語モデル / N-gram language model
キーワード(3)(和/英) LSI法 / LSI method
キーワード(4)(和/英) 拡張辞書 / expanded dictionary
キーワード(5)(和/英) キーワードスポッティング / keyword spotting
第 1 著者 氏名(和/英) 山本 哲也 / Tetsuya Yamamoto
第 1 著者 所属(和/英) 龍谷大学理工学部
Faculty of Science and Technology, Ryukoku University
第 2 著者 氏名(和/英) 緒方 淳 / Jun Ogata
第 2 著者 所属(和/英) 龍谷大学理工学部
Faculty of Science and Technology, Ryukoku University
第 3 著者 氏名(和/英) 有木 康雄 / Yasuo Ariki
第 3 著者 所属(和/英) 龍谷大学理工学部
Faculty of Science and Technology, Ryukoku University
発表年月日 2002/1/18
資料番号
巻番号(vol) vol.101
号番号(no) 604
ページ範囲 pp.-
ページ数 6
発行日