講演名 2002/12/12
音声・音楽識別を目的とした特徴量の検討
谷口 徹, 大川 茂樹, 白井 克彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声・音楽識別は音響コンテンツへのインデキシングやその前処理など、様々な応用が期待されており、現在多くの手法が提案されている。本研究では特に音声・音楽識別に用いられる特徴量に注目し、先行研究で有効性が示されている4種の特徴量の評価を行った。評価には性別やBGMの有無、歌声と楽器音の重畳などを考慮し設定した7種のクラスによりラベル付けをしたデータセットを用い、各特徴量の誤認識の傾向を分析した。
抄録(英) Speech/Music discrimination has been studied for various applications such as automatic indexing of audio data. In this paper, we focus on four acoustic features examined in related studies and evaluate these features with audio data sets classified into seven audio classes.
キーワード(和) 音声.音楽識別 / 音響特徴量 / 音響情報検索
キーワード(英) Speech/Music discrimination / Acoustic feature / Audio retrieval
資料番号 SP2002-135
発行日

研究会情報
研究会 SP
開催期間 2002/12/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 音声・音楽識別を目的とした特徴量の検討
サブタイトル(和)
タイトル(英) A Study of Features for Speech/Music Discrimination
サブタイトル(和)
キーワード(1)(和/英) 音声.音楽識別 / Speech/Music discrimination
キーワード(2)(和/英) 音響特徴量 / Acoustic feature
キーワード(3)(和/英) 音響情報検索 / Audio retrieval
第 1 著者 氏名(和/英) 谷口 徹 / Toru TANIGUCHI
第 1 著者 所属(和/英) 早稲田大学理工学部情報学科
School of Science and Engineering, Waseda University
第 2 著者 氏名(和/英) 大川 茂樹 / Shigeki OKAWA
第 2 著者 所属(和/英) 千葉工業大学情報科学部情報ネットワーク学科
Dept. Network Science, Chiba Institute of Technology
第 3 著者 氏名(和/英) 白井 克彦 / Katsuhiko SHIRAI
第 3 著者 所属(和/英) 早稲田大学理工学部情報学科
School of Science and Engineering, Waseda University
発表年月日 2002/12/12
資料番号 SP2002-135
巻番号(vol) vol.102
号番号(no) 529
ページ範囲 pp.-
ページ数 5
発行日