講演名 2002/7/11
シーンカット検出のためのMPEG Audioデータのクラスタリングに関する一考察
二反田 直己, 長谷山 美紀, 北島 秀夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) シーンの境界であるシーンカットの検出法として,オーディオ信号の変化部に着眼した手法が提案されている.しかし,オーディオ信号にはしばしば無音部が挿入されるため,オーディオ信号の変化部にはシーンカットのみならず,有音部と無音部の境界が含まれてしまい,全ての変化部がシーンカットとは限らない.従って,オーディオ信号の変化部のみからシーンカットを検出することは困難となる.そこで本文では,オーディオ信号の変化部を検出し,変化部を境界として得られたセグメントを有音部と無音部に分類することで,高精度にシーンカットを検出する手法を提案する.また,提案手法はMPEG Audioで符号化されたデータに対し,復号せずに直接処理を行なうことが可能であり,MPEGで符号化された動画像でのシーンカット検出への適応が期待できる.
抄録(英) Transitions in audio signals are generally utilized for scene cut detection. However, since silence audio segments are usually inserted into the audio signals, the transitions in the audio signals include not only the scene cuts but also boundaries between silence and non-silence segments. Therefore, the scene cuts can not be detected by using only the transitions. In this paper, we propose an effective audio classification method for scene cut detection. Our proposed method works as follows: (1) it detects the transitions in the audio singals automatically; (2) it divides the audio signals into segments bounded by the transitions detected in (1); (3) it classifies the segments into the silence and non-silence audio classes. By using our method, the scene cuts can be detcted accurately because the the silence class contains the scene cuts. In addition, since our method can directly process MPEG Audio data without decoding procedures, detection of the scene cuts in MPEG compressed data can be applied easily.
キーワード(和) シーン / シーンカット検出 / オーディオ分類 / MPEG Audio
キーワード(英) scene / scene cut detection / audio classification / MPEG Audio
資料番号 MVE2002-23
発行日

研究会情報
研究会 MVE
開催期間 2002/7/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Media Experience and Virtual Environment (MVE)
本文の言語 JPN
タイトル(和) シーンカット検出のためのMPEG Audioデータのクラスタリングに関する一考察
サブタイトル(和)
タイトル(英) A Note on Classification of MPEG Audio Data for Scene Cut Detection
サブタイトル(和)
キーワード(1)(和/英) シーン / scene
キーワード(2)(和/英) シーンカット検出 / scene cut detection
キーワード(3)(和/英) オーディオ分類 / audio classification
キーワード(4)(和/英) MPEG Audio / MPEG Audio
第 1 著者 氏名(和/英) 二反田 直己 / Naoki NITANDA
第 1 著者 所属(和/英) 北海道大学大学院工学研究科
School of Engineering, Hokkaido University
第 2 著者 氏名(和/英) 長谷山 美紀 / Miki HASEYAMA
第 2 著者 所属(和/英) 北海道大学大学院工学研究科
School of Engineering, Hokkaido University
第 3 著者 氏名(和/英) 北島 秀夫 / Hideo KITAJIMA
第 3 著者 所属(和/英) 北海道大学大学院工学研究科
School of Engineering, Hokkaido University
発表年月日 2002/7/11
資料番号 MVE2002-23
巻番号(vol) vol.102
号番号(no) 219
ページ範囲 pp.-
ページ数 6
発行日