講演名 2003/9/22
HMMを用いた音声・音楽識別(信号処理・符号化・一般)
谷口 徹, 安達 了慈, 大川 茂樹, 白井 克彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声・音楽識別は音響コンテンツヘのインデキシング・その前処理など、様々な応用が期待されており、現在多くの手法が提案されている。本報告では、HMMを用いた音声・音楽識別を提案し、単純なleft-to-right型のHMMを用いても、従来の特徴量ベースの識別器よりも高い識別率が得られることを、ラジオ放送音源データを用いて示した。また、音声・音楽よりも詳細な7つのサブカテゴリを設定し、HMMを作成することによって、さらに高い正解識別率が得られることを示した。
抄録(英) Speech/Music discrimination has been studied for various applications such as automatic indexing of audio data. In this report, we suggest a method using HMM to discriminate speech and music. Although the HMM is simple left-to-right HMM, experimental results showed this method achieves higher discrimination rate than conventional feature-based method. And with Seven HMM categorized more detailed than category of speech and music, more speech and music sounds were correctly discriminated than with speech and music HMM.
キーワード(和) 音声・音楽識別 / HMM / 音声文書検索
キーワード(英) Speech/Music discrimination / HMM / Audio retrieval
資料番号 DSP2003-97,SP2003-92
発行日

研究会情報
研究会 DSP
開催期間 2003/9/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Digital Signal Processing (DSP)
本文の言語 JPN
タイトル(和) HMMを用いた音声・音楽識別(信号処理・符号化・一般)
サブタイトル(和)
タイトル(英) Speech/Music Discrimination using HMM
サブタイトル(和)
キーワード(1)(和/英) 音声・音楽識別 / Speech/Music discrimination
キーワード(2)(和/英) HMM / HMM
キーワード(3)(和/英) 音声文書検索 / Audio retrieval
第 1 著者 氏名(和/英) 谷口 徹 / Toru TANIGUCHI
第 1 著者 所属(和/英) 早稲田大学理工学部コンピュータ・ネットワーク工学科
School of Science and Engineering, Waseda University
第 2 著者 氏名(和/英) 安達 了慈 / Akishige ADACHI
第 2 著者 所属(和/英) 早稲田大学理工学部コンピュータ・ネットワーク工学科
School of Science and Engineering, Waseda University
第 3 著者 氏名(和/英) 大川 茂樹 / Shigeki OKAWA
第 3 著者 所属(和/英) 千葉工業大学情報科学部情報ネットワーク学科
Dept. Network Science, Chiba Institute of Technology
第 4 著者 氏名(和/英) 白井 克彦 / Katsuhiko SHIRAI
第 4 著者 所属(和/英) 早稲田大学理工学部コンピュータ・ネットワーク工学科
School of Science and Engineering, Waseda University
発表年月日 2003/9/22
資料番号 DSP2003-97,SP2003-92
巻番号(vol) vol.103
号番号(no) 329
ページ範囲 pp.-
ページ数 5
発行日