講演名 2005/6/16
音声とテキストの自動対応付けによる音声インデキシング手法とその評価(要約, 検索, 認識・理解・対話・一般)
渡邉 括行, 杉山 雅英,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では, 現在開発をすすめているマルチメディアデータ検索システムとその中核を構成する音声インデキシングモジュールについて述べる.特にインデキシングモジュールに対して適用した音声とテキストの自動対応付け手法について評価を行った.Voice-Pause法を対応付け手法として適用し, 発話スタイルの異なる音声データ「日本語話し言葉コーパス」(CSJ)の学会講演音声および「五体不満足データベース」を評価に用いた.発話スタイルの違いに対応するために, Voice-Pause法のパラメータの調整を行った.提案手法をCSJ講演音声に適用した結果, ラベルとの平均誤差は0.506秒であり, 朗読音声に対しては0.382秒という性能が得られた.これは音声データの発話スタイルが異る場合でもほぼ同等のインデキシング性能が得られることを示した.
抄録(英) This paper proposes the audio indexing method for multimedia data retrieval system which we are developing. As the audio indexing module, the Voice-Pause method was applied to the academic presentation speech (CSJ core database) and recitation database. In order to cope with the change of speech speed, parameters for the Voice-Pause method are adjusted to consider the difference between actual duration of speech and its estimated. Using proposed method, average gap time is 0.506 sec for the academic presentation speech and 0.382 sec for the recitation database. The experimental results show that the performance of the proposed indexing method has almost same average gap time independently of the speech styles.
キーワード(和) 音声インデキシング / 動的計画法 / マルチメディア検索システム
キーワード(英) Audio Indexing / DP Matching / Multimedia Retrieval System
資料番号 SP2005-22
発行日

研究会情報
研究会 SP
開催期間 2005/6/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 音声とテキストの自動対応付けによる音声インデキシング手法とその評価(要約, 検索, 認識・理解・対話・一般)
サブタイトル(和)
タイトル(英) Audio Indexing Method using Audio/Text Automatic Correspondence Generation and Its Evaluation
サブタイトル(和)
キーワード(1)(和/英) 音声インデキシング / Audio Indexing
キーワード(2)(和/英) 動的計画法 / DP Matching
キーワード(3)(和/英) マルチメディア検索システム / Multimedia Retrieval System
第 1 著者 氏名(和/英) 渡邉 括行 / Katsuyuki WATANABE
第 1 著者 所属(和/英) 会津大学大学院コンピュータ理工学研究科
Graduate School of Computer Science and Engineering, The Univ. of Aizu
第 2 著者 氏名(和/英) 杉山 雅英 / Masahide SUGIYAMA
第 2 著者 所属(和/英) 会津大学大学院コンピュータ理工学研究科
Graduate School of Computer Science and Engineering, The Univ. of Aizu
発表年月日 2005/6/16
資料番号 SP2005-22
巻番号(vol) vol.105
号番号(no) 132
ページ範囲 pp.-
ページ数 6
発行日