講演名 2009-12-22
Web上の語彙を利用した音声クエリ拡張による検索語検出(音声検索・要約,第11回音声言語シンポジウム)
栗城 吾央, 伊藤 慶明, 小嶋 和徳, 石亀 昌明, 田中 和世, 李 時旭,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) マルチメディアコンテンツの増加に伴い,ユーザが見たい場面を容易に検索できる機能が求められる.その実現のため,マルチメディアデータの音声情報を利用し,検索語(クエリ)の含まれる区間を特定する音声中の検索語検出方式の研究が盛んに行われるようになった.データ中の音声情報を音声認識する方式が代表的であるが,辞書に未登録の単語(未知語)は検索が困難である.また,クエリが音声で与えられた際にクエリが未知語だった場合,正しいテキスト列に変換できず検索は困難となる.我々は,音声認識結果に付加される単語の読み系列を利用し,クエリが未知語であっても類似する読み系列の区間を特定することで検索可能とする方式を提案している.クエリが音声で与えられた場合,音声を単語認識するのでは未知語に対応できない.そこで本稿では,音声で与えられた未知語クエリへの対応方式としてWeb上の語彙を利用する方式を提案する.事前にWeb上で最新の語彙を獲得しWeb語彙辞書とすることで,未知語の音声クエリに対しても正しい単語(読み系列)に変換し,検索を可能にする.本手法により,既知語音声クエリに対しても本手法の有効性を確認した.
抄録(英) According to the increase of multimedia contents, many users want a new function to watch the video section of their interest easily. For this purpose, many Spoken Term Detection(STD)researches have been conducted using results of a speech recognizer. Such methods have a difficulty in dealing with out-of-vocabulary(OOV)words for a speech recognizer. The STD task becomes more difficult for the speech in video data when an OOV query is given by speech because the speech cannot be recognized into the correct word by a speech recognizer. Therefore, we have proposed a method to enable to retrieve an OOV word section by using phone sequences obtained form the result of a speech recognizer. The paper proposes a method to deal with an OOV speech query by extending the vocabulary that is extracted from Web assuming the correct words of an OOV speech query exist on Web, and the vocabulary can cover OOV speech query. The method enabled to detect an OOV speech query and improved the retrieval performance for an in-vocabulary speech query.
キーワード(和) 音声認識 / 検索語検出 / 未知語 / サブワード / 音声クエリ
キーワード(英) speech recognition / spoken term detection / out-of-vocabulary / subword / speech query
資料番号 NLC2009-20,SP2009-84
発行日

研究会情報
研究会 NLC
開催期間 2009/12/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) Web上の語彙を利用した音声クエリ拡張による検索語検出(音声検索・要約,第11回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Spoken Term Detection by Query Term Extension using Vocabulary on Web for Speech Query Terms
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / speech recognition
キーワード(2)(和/英) 検索語検出 / spoken term detection
キーワード(3)(和/英) 未知語 / out-of-vocabulary
キーワード(4)(和/英) サブワード / subword
キーワード(5)(和/英) 音声クエリ / speech query
第 1 著者 氏名(和/英) 栗城 吾央 / Go KURIKI
第 1 著者 所属(和/英) 岩手県立大学ソフトウェア情報学研究科
Faculty of Software and Information Science, Iwate Prefectural University
第 2 著者 氏名(和/英) 伊藤 慶明 / Yoshiaki ITOH
第 2 著者 所属(和/英) 岩手県立大学ソフトウェア情報学研究科
Faculty of Software and Information Science, Iwate Prefectural University
第 3 著者 氏名(和/英) 小嶋 和徳 / Kazunori KOJIMA
第 3 著者 所属(和/英) 岩手県立大学ソフトウェア情報学研究科
Faculty of Software and Information Science, Iwate Prefectural University
第 4 著者 氏名(和/英) 石亀 昌明 / Masaaki ISHIGAME
第 4 著者 所属(和/英) 岩手県立大学ソフトウェア情報学研究科
Faculty of Software and Information Science, Iwate Prefectural University
第 5 著者 氏名(和/英) 田中 和世 / Kazuyo TANAKA
第 5 著者 所属(和/英) 筑波大学大学院図書館情報メディア研究科
Institute of Library and Information Science, Tsukuba University
第 6 著者 氏名(和/英) 李 時旭 / Shi-wook Lee
第 6 著者 所属(和/英) 産業技術総合研究所情報技術研究部門
Information Technology Research Institute, AIST
発表年月日 2009-12-22
資料番号 NLC2009-20,SP2009-84
巻番号(vol) vol.109
号番号(no) 355
ページ範囲 pp.-
ページ数 6
発行日