講演名 2005/6/16
語彙フリー音声検索におけるサブワードの検討および災害放送検索システムへの応用(要約, 検索, 認識・理解・対話・一般)
岩田 耕平, 伊藤 慶明, 小嶋 和徳, 石亀 昌明, 田中 和世, 李 時旭,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) パソコン・ハードディスクレコーダーの普及に伴い, ユーザが見たい場面を容易に検索できる機能が必要不可欠である.本稿では通常の音声認識システムを用いず, サブワードモデルを用いた音声検索手法を提案する.本方式では, サブワードモデルを用いる点およびそのサブワードモデル間の音響的な距離を利用する点に特徴がある.本稿では, 音声認識では一般的なtriphoneモデルと, 音素を時間軸上で精緻化した半音素モデル, Sub-Phonetic Segmentモデルを利用し, モデル間の検索性能について比較実験を通して新しいモデル優位性を検証した.また, サブワードモデル間の音響的な距離の導入が有効であることを検証した.さらに, 音声検索を利用したアプリケーションとして, 昨年発生した新潟中越地震において, テレビで実際に放送された安否確認放送に対する検索実験を行い, システムの有用性, 可能性を確認した.
抄録(英) According to the recent spread of personal computers and video hard-disc recorders, a new function is needed such that it is easy for a user to identify the scene that a user wants to watch in a video data. For this purpose, this paper proposes a speech retrieval method that does not use a general speech recognizer but a subword models. The method is characterized by using subword models and acoustic distance between the subword models. We conducted some experiments for evaluating the retrieval performance between triphone that are general models in a speech recognizer, demi-phone and Sub-Phonetic Segment (SPS) that are more precise models than triphone models on time axis, and illustrated a better performance was obtained by using new models such as SPS and acoustic distances between subword models. Furthermore, we applied the method to the application of retrieving the safety information in TV broadcast of Niigata-Chuetsu earthquake, and confirmed the necessity and possibility of the proposed system.
キーワード(和) 音声検索 / サブワード / 語彙フリー / モデル間距離 / 災害情報
キーワード(英) Speech retrieval / subword / distance between models / disaster information
資料番号 SP2005-21
発行日

研究会情報
研究会 SP
開催期間 2005/6/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 語彙フリー音声検索におけるサブワードの検討および災害放送検索システムへの応用(要約, 検索, 認識・理解・対話・一般)
サブタイトル(和)
タイトル(英) A Study of subword models for vocabulary-free spoken document retrieval system and its application for Retrieving TV Broadcasts in a Disaster
サブタイトル(和)
キーワード(1)(和/英) 音声検索 / Speech retrieval
キーワード(2)(和/英) サブワード / subword
キーワード(3)(和/英) 語彙フリー / distance between models
キーワード(4)(和/英) モデル間距離 / disaster information
キーワード(5)(和/英) 災害情報
第 1 著者 氏名(和/英) 岩田 耕平 / Kohei IWATA
第 1 著者 所属(和/英) 岩手県立大学ソフトウェア情報学部
Faculty of Software and Information Science Iwate Prefectural University
第 2 著者 氏名(和/英) 伊藤 慶明 / Yoshiaki ITOH
第 2 著者 所属(和/英) 岩手県立大学ソフトウェア情報学部
Faculty of Software and Information Science Iwate Prefectural University
第 3 著者 氏名(和/英) 小嶋 和徳 / Kazunori KOJIMA
第 3 著者 所属(和/英) 岩手県立大学ソフトウェア情報学部
Faculty of Software and Information Science Iwate Prefectural University
第 4 著者 氏名(和/英) 石亀 昌明 / Masaaki ISHIGAME
第 4 著者 所属(和/英) 岩手県立大学ソフトウェア情報学部
Faculty of Software and Information Science Iwate Prefectural University
第 5 著者 氏名(和/英) 田中 和世 / Kazuyo TANAKA
第 5 著者 所属(和/英) 筑波大学大学院図書館情報メディア研究科
Institute of Library and Information Science Tsukuba University
第 6 著者 氏名(和/英) 李 時旭 / Shi wook Lee
第 6 著者 所属(和/英) 産業技術総合研究所情報技術研究部門
Information Technology Research Institute AIST
発表年月日 2005/6/16
資料番号 SP2005-21
巻番号(vol) vol.105
号番号(no) 132
ページ範囲 pp.-
ページ数 6
発行日