講演名 1997/12/12
ファジイ理論を用いた音声データによるカット点検出の精度向上に関する考察
薄田 隆博, 長谷山 美紀, 北島 秀夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本文では, 従来のカット点検出手法で検出が困難とされているフェードやワイプ等について, その検出精度を向上させるために, ビテオ信号に対応する音声データを用いる手法について検討を行う. 提案手法は, 音声データからPARCOR(偏自己相関)係数を求め, ファジイc-meansクラスタリングを用いて, 画像データにより推定されているカット点部分の音声信号を複数のクラスタに分類する. 得られたクラスタ値が大きく変化する時刻に画像のカット点が存在する可能性があることに注目し, カット点検出の精度向上のために応用する.
抄録(英) This paper describes a study of improvement for cut detection of video signals. The existent methods often fail to detect cut positions at fading in, out, or wiping scenes. The proposed algorithm improves them by using a fuzzy c-means clustering method. The clustered targets are PARCOR coefficients computed from audio signals corresponding to the video ones. The obtained cluster values are varied regardless of the failures if the audio signals are alternated. Therefore, it is expected that the alteration of the cluster values can assist the cut detection effectively.
キーワード(和) カット点検出 / PARCOR係数 / ファジイc-meansクラスタリング
キーワード(英) cut detection / PARCOR coefficient / fuzzy c-means clustering
資料番号 IE97-115
発行日

研究会情報
研究会 IE
開催期間 1997/12/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Image Engineering (IE)
本文の言語 JPN
タイトル(和) ファジイ理論を用いた音声データによるカット点検出の精度向上に関する考察
サブタイトル(和)
タイトル(英) Improvement of Cut Detection by Audio Signal Analysis with a Fuzzy Theory
サブタイトル(和)
キーワード(1)(和/英) カット点検出 / cut detection
キーワード(2)(和/英) PARCOR係数 / PARCOR coefficient
キーワード(3)(和/英) ファジイc-meansクラスタリング / fuzzy c-means clustering
第 1 著者 氏名(和/英) 薄田 隆博 / Takahiro Usuda
第 1 著者 所属(和/英) 北海道大学工学研究科
School of Engineering, Hokkaido University
第 2 著者 氏名(和/英) 長谷山 美紀 / Miki Haseyama
第 2 著者 所属(和/英) 北海道大学工学研究科
School of Engineering, Hokkaido University
第 3 著者 氏名(和/英) 北島 秀夫 / Hideo Kitajima
第 3 著者 所属(和/英) 北海道大学工学研究科
School of Engineering, Hokkaido University
発表年月日 1997/12/12
資料番号 IE97-115
巻番号(vol) vol.97
号番号(no) 430
ページ範囲 pp.-
ページ数 6
発行日