講演抄録/キーワード |
講演名 |
2005-02-03 12:00
ファジィc-means法を用いたオーディオ信号の分割・分類法 ~ 音声及び音楽クラス間の距離の定義に関する考察 ~ ○二反田直己・長谷山美紀・北島秀夫(北大) |
抄録 |
(和) |
ビデオ信号とオーディオ信号を統合した映像信号の検索システムを構築する際,前処理として映像信号の分割・分類が必要となる.我々は,以前,映像信号のオーディオ部に着目し,オーディオ信号が切り換わる時刻(オーディオカット)を検出し,オーディオカットを境界とするセグメントを無音,音声,音楽,音楽付き音声,雑音付き音声の 5 種類のクラスに分類する手法を提案した.本稿では,音楽付き音声に着目し,音楽付き音声-音声間,及び音楽付き音声-音楽間の距離(クラス間距離)をファジィ c-means 法より得られる帰属度を用いて表現する手法を提案する.提案手法により算出されるクラス間距離を用いることで,音楽付き音声が音声,音楽のどちらに類似した信号であるかを調べることが可能となる. |
(英) |
Automatic segmentation and classification technique of audio signal is required for audiovisual indexing, and we have been proposed an audio signal segmentation and classification method. This method segments the audio signal into different audio signals at their boundaries, and classifies them into five audio classes, which are silence, speech, music, speech with music, and speech with noise. This paper defines a distance between speech and music class in order to judge that a speech with music class is similar to which speech or music class. The proposed method consists of three steps: (1) audio features, which represent the characteristic of speech, music, and speech with music signal, are extracted; (2) principal component analysis is applied to the extracted audio features; (3) fuzzy c-means clustering is applied to the principal components, and distance can be computed by using membership values, which are obtained from fuzzy clustering. Experimental results performed by applying the proposed method to real audio signal are shown to verify its high performance. |
キーワード |
(和) |
オーディオ信号 / 分割 / 分類 / インデキシング / ファジィ c-means 法 / / / |
(英) |
audio signal / segmentation / classification / indexing / fuzzy c-means / / / |
文献情報 |
信学技報, vol. 104, no. 648, IE2004-183, pp. 51-56, 2005年2月. |
資料番号 |
IE2004-183 |
発行日 |
2005-01-27 (ITS, IE) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|
研究会情報 |
研究会 |
IE ITS ITE-AIT ITE-ME |
開催期間 |
2005-02-03 - 2005-02-04 |
開催地(和) |
NHK札幌,市民会館,かでる27 |
開催地(英) |
|
テーマ(和) |
ITS画像処理,映像メディアおよび一般(IE, ITS,ITE,SID日本支部共催) |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
IE |
会議コード |
2005-02-IE-ITS |
本文の言語 |
日本語 |
タイトル(和) |
ファジィc-means法を用いたオーディオ信号の分割・分類法 |
サブタイトル(和) |
音声及び音楽クラス間の距離の定義に関する考察 |
タイトル(英) |
Audio Signal Segmentation and Classification using Fuzzy C-Means Clustering |
サブタイトル(英) |
A Study on Definition of Distance between Speech and Music Class |
キーワード(1)(和/英) |
オーディオ信号 / audio signal |
キーワード(2)(和/英) |
分割 / segmentation |
キーワード(3)(和/英) |
分類 / classification |
キーワード(4)(和/英) |
インデキシング / indexing |
キーワード(5)(和/英) |
ファジィ c-means 法 / fuzzy c-means |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
二反田 直己 / Naoki Nitanda / ニタンダ ナオキ |
第1著者 所属(和/英) |
北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.) |
第2著者 氏名(和/英/ヨミ) |
長谷山 美紀 / Miki Haseyama / ハセヤマ ミキ |
第2著者 所属(和/英) |
北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.) |
第3著者 氏名(和/英/ヨミ) |
北島 秀夫 / Hideo Kitajima / キタジマ ヒデオ |
第3著者 所属(和/英) |
北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2005-02-03 12:00:00 |
発表時間 |
30分 |
申込先研究会 |
IE |
資料番号 |
ITS2004-49, IE2004-183 |
巻番号(vol) |
vol.104 |
号番号(no) |
no.646(ITS), no.648(IE) |
ページ範囲 |
pp.51-56 |
ページ数 |
6 |
発行日 |
2005-01-27 (ITS, IE) |
|