講演名 2007/11/21
Sinusoidal trajectoryを利用した音楽中の音声検出法
谷口 徹, 白井 克彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,sinusoidal trajectoryの時間的特徴を用いた音声検出手法について述べた.定常妨害音に対する手法はよく知られているが,音声,楽器音など複雑な時間・周波数構造を持った非定常妨害音に対応する手法は未確立である.1チャネル信号の音楽音中の音声検出を目指し,sinusoidal trajectoryの時間的特徴による音カテゴリモデルに基づく手法と,それに加えてtrajectoryの類似性に基づくクラスタリングを利用した2つの手法を提案した.新聞読み上げ音声と楽器演奏音の混合音データセットにより評価したところ,十分な明瞭性が得られ,0dBの混合音サンプルに対してsegmental SNRにおいて平均で+6.41dBと+7.19dBの改善を実現した.時間的類似性を考慮したクラスタリングを利用する事で,検出精度の向上が得られる事が分かった.
抄録(英) In this article, a speech detection method using temporal characteristics of the sinusoidal trajectories extracted from mixed sounds is described. While detection methods for stationary noise were well developed, how to deal with nonstationary sound such as background music or competing speech, which has complicated spectral and temporal structures remains a problem. We proposed two detection methods: the first one utilizes sound-category models based on temporal characteristics of the sinusoidal trajectories and the second one includes a clustering step based on similarity between trajectories in order to detect speech mixed with music in a one-channel-sound. In the experiments using a dataset of mixed speech with instrumental sound, the average of improvement of the segmental SNR are +6.41dB and +7.19dB, respectively, with enough intelligibility. Therefore, the detection method using clustering of trajectory is effective to improve the accuracy of the detection of speech with background music.
キーワード(和) 複合正弦波 / sinusoidal trajectory / 音声検出 / 音楽 / 楽器音 / 音声分離
キーワード(英) sinusoidal analysis / sinusoidal trajectory / speech detection / music / instrumental sound / speech separation
資料番号 SP2007-88
発行日

研究会情報
研究会 SP
開催期間 2007/11/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) Sinusoidal trajectoryを利用した音楽中の音声検出法
サブタイトル(和)
タイトル(英) Detection method for speech comteting music using sinusoidal trajectories
サブタイトル(和)
キーワード(1)(和/英) 複合正弦波 / sinusoidal analysis
キーワード(2)(和/英) sinusoidal trajectory / sinusoidal trajectory
キーワード(3)(和/英) 音声検出 / speech detection
キーワード(4)(和/英) 音楽 / music
キーワード(5)(和/英) 楽器音 / instrumental sound
キーワード(6)(和/英) 音声分離 / speech separation
第 1 著者 氏名(和/英) 谷口 徹 / Toru TANIGUCHI
第 1 著者 所属(和/英) 早稲田大学理工学術院情報理工学科
Department of Computer Science and Engineering, Waseda University
第 2 著者 氏名(和/英) 白井 克彦 / Katsuhiko SHIRAI
第 2 著者 所属(和/英) 早稲田大学理工学術院情報理工学科
Department of Computer Science and Engineering, Waseda University
発表年月日 2007/11/21
資料番号 SP2007-88
巻番号(vol) vol.107
号番号(no) 356
ページ範囲 pp.-
ページ数 6
発行日