講演名 2006-02-20
オーディオ信号を用いたオーディオビジュアルインデキシングの高精度化に関する一検討(インデキシング・画像検索, ITS画像処理,映像メディア及び一般)
二反田 直己, 長谷山 美紀, 北島 秀夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 映像信号の検索システムを構築する際,前処理として映像信号をショットやシーンに分割し,インデックスを付加する必要がある.そのため,従来よりショットやシーンの切り換わる時刻(ショットカット,シーンカット)を検出する手法が提案されている.しかしながら,従来手法は,映像信号より得られるオーディオ信号を音声や音楽のクラスに分類し,分類されたクラスが切り換わる時刻とショットカットが一致する時刻をシーンカットと判断するため,隣接するシーンのオーディオ信号が同一のクラスに分類された場合,シーンカットの未検出が発生する.この問題を解決するために,本稿では,主成分分析とファジィc-means法を用いたオーディオインデキシングを提案し,既存のショットカット検出法と組み合わせることで,隣接するショット間の類似度を考慮した新たなオーディオビジュアルインデキシングを提案する.隣接するショット間の類似度を定義することで,従来手法の問題を解決し,高精度なオーディオビジュアルインデキシングが可能となる.
抄録(英) An accurate audiovisual indexing method is proposed in this paper. The proposed method classifies the audio signal into the following five audio classes: silence, speech, music, speech with music background, and speech with noise background. For this audio classification, both principal component analysis (PCA) and fuzzy c-means clustering (FCM) are utilized. The effective features can be theoretically extracted by using PCA, and the reliability of the clustering results can be measured by using FCM. Moreover, combination use of the proposed method and video segmentation technique, which can accurately detect the segmentation point, make it possible to measure the similarity between two adjacent shots. According to the similarity, the scene transition can be accurately detected. Experimental results obtained by the combination approach to actual audiovisual materials are shown to verify its effectiveness.
キーワード(和) オーディオビジュアル / インデキシング / 主成分分析 / ファジィc-means法
キーワード(英) audiovisual / indexing / principal component analysis / fuzzy c-means clustering
資料番号 ITS2005-60,IE2005-267
発行日

研究会情報
研究会 ITS
開催期間 2006/2/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Intelligent Transport Systems Technology (ITS)
本文の言語 JPN
タイトル(和) オーディオ信号を用いたオーディオビジュアルインデキシングの高精度化に関する一検討(インデキシング・画像検索, ITS画像処理,映像メディア及び一般)
サブタイトル(和)
タイトル(英) A study on accurate audiovisual indexing using audio signal
サブタイトル(和)
キーワード(1)(和/英) オーディオビジュアル / audiovisual
キーワード(2)(和/英) インデキシング / indexing
キーワード(3)(和/英) 主成分分析 / principal component analysis
キーワード(4)(和/英) ファジィc-means法 / fuzzy c-means clustering
第 1 著者 氏名(和/英) 二反田 直己 / Naoki NITANDA
第 1 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Science and Technology, Hokkaido University
第 2 著者 氏名(和/英) 長谷山 美紀 / Miki HASEYAMA
第 2 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Science and Technology, Hokkaido University
第 3 著者 氏名(和/英) 北島 秀夫 / Hideo KITAJIMA
第 3 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Science and Technology, Hokkaido University
発表年月日 2006-02-20
資料番号 ITS2005-60,IE2005-267
巻番号(vol) vol.105
号番号(no) 608
ページ範囲 pp.-
ページ数 6
発行日