講演名 2003/5/23
メタデータ生成のための背景音楽の類似検索
須賀 啓敏, 仲西 正,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,映像中で使われている背景音楽(BGM)の曲名をメタデータとして付与するために,人の声と背景音楽が混合した音響信号を検索キーとして,その背景音楽が類似する音響信号を音楽DBから高速に検索する手法を提案する.提案手法では,この背景雑音を検索するためにロバスト推定の考え方に基づいた非類似度を用いる.また非定常雑音の性質に基づいた特徴ベクトルの圧縮と多次元インデックスの利用により高速化を実現している.特徴ベクトルを圧縮することによって生じる性能劣化を抑制するために映像中の背景音楽の継続性を利用した結果,高速化しない場合と同程度の検索精度が得られることがわかった.実験では,2525曲(約193時間)分の音楽DBを構築して実際の音楽番組の背景音楽部分に提案手法を適用した結果,約90%の検索精度が得られ,検索時間は検索キー1つ(約4秒間)あたり,約3秒であった.
抄録(英) In this paper, we propose a method of music retrieval to identify titles of back ground music (BGM) used in TV programs. In this case, the BGM is partly hidden by irregular noises which are voices of the master, sounds of the closing a door, and so on. In our method, to reduce the influence of the irregular noises, we use the dissimilarity that is based on the idea of robust estimation. And to retrieve music fast, we compress music based on the property of the irregular noises, and use the index structure of multi-dimensional data. To maintain the retrieval accuracy in spite of the compression, we make good use of the continuity of the music. In experiments, using the music database which contain about 2,500 songs (about 193 hours), we can identify the titles of the back ground music in real-time.
キーワード(和) 類似音楽検索 / 背景音楽 / 多次元空間インデックス / メタデータ / ロバスト推定
キーワード(英) music retrieval / back ground music / index structure for multi-dimensional data / metadata / robust estimation
資料番号 PRMU2003-12,MI2003-12
発行日

研究会情報
研究会 MI
開催期間 2003/5/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Medical Imaging (MI)
本文の言語 JPN
タイトル(和) メタデータ生成のための背景音楽の類似検索
サブタイトル(和)
タイトル(英) The Similar Retrieval of Back Ground Music for Generating Metadata
サブタイトル(和)
キーワード(1)(和/英) 類似音楽検索 / music retrieval
キーワード(2)(和/英) 背景音楽 / back ground music
キーワード(3)(和/英) 多次元空間インデックス / index structure for multi-dimensional data
キーワード(4)(和/英) メタデータ / metadata
キーワード(5)(和/英) ロバスト推定 / robust estimation
第 1 著者 氏名(和/英) 須賀 啓敏 / YOSHIHARU Suga
第 1 著者 所属(和/英) 日本電信電話株式会社 NTTサイバースペース研究所
NTT Cyber Space Laboratories, NTT Corporation
第 2 著者 氏名(和/英) 仲西 正 / TADASHI Nakanishi
第 2 著者 所属(和/英) 日本電信電話株式会社 NTTサイバースペース研究所
NTT Cyber Space Laboratories, NTT Corporation
発表年月日 2003/5/23
資料番号 PRMU2003-12,MI2003-12
巻番号(vol) vol.103
号番号(no) 98
ページ範囲 pp.-
ページ数 6
発行日