講演名 1999/8/5
音声の調波構造を利用した音源分離手法
阪本 正治, 山田 道夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では、複数話者の音声信号が混ざった1チャネル信号から、各話者の音声を分離する手法について述べる。複数話者の音声の混合音をガボールウェーブレッドを用いてウェーブレット変換し、混合音の時間-周波数解析を得る。特徴抽出部では、ウエーブレット係数から、分離の手がかりとなる特徴量を抽出し、音響的なサブグループを形成する。このサブグループを、Bregmanの聴覚による情景解析の拘束条件を用いてグルーピングし、各話者の音声信号に分離する。本手法を用いて、男声と女声の連続母音の混合音から、男声と女声を分離する実験を行った。
抄録(英) This paper presents a sound segregation method that can segregate speech sounds from a variety of interference sound. First, a time-frequency representation of mixed sounds is derived from a Gabor wavelet transform. Next, subgroups of time-frequency elements are formed according to several acoustical features of the time-frequency representation. Finally, a search strategy is used to group the subgroups according to Bregman's concept of auditory scene analysis. We conducted a segregation experiment, using a mixture of male and female voices.
キーワード(和) 音源分離 / ガボールウェーブレット / ウェーブレット変換 / 聴覚による情景解析
キーワード(英) sound segregation / Gabor wavelet / wavelet transform / auditory scene analysis
資料番号 SP99-56
発行日

研究会情報
研究会 SP
開催期間 1999/8/5(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 音声の調波構造を利用した音源分離手法
サブタイトル(和)
タイトル(英) A sound source segregation method using the harmonic structure of the human voice
サブタイトル(和)
キーワード(1)(和/英) 音源分離 / sound segregation
キーワード(2)(和/英) ガボールウェーブレット / Gabor wavelet
キーワード(3)(和/英) ウェーブレット変換 / wavelet transform
キーワード(4)(和/英) 聴覚による情景解析 / auditory scene analysis
第 1 著者 氏名(和/英) 阪本 正治 / Masaharu Sakamoto
第 1 著者 所属(和/英) 東京大学数理科学研究科:(日本アイ・ビー・エム(株)東京基礎研究所)
Graduate School of Mathematical Sciences, University of Tokyo:(Tokyo Research Laboratory, IBM Japan)
第 2 著者 氏名(和/英) 山田 道夫 / Michio Yamada
第 2 著者 所属(和/英) 東京大学数理科学研究科
Graduate School of Mathematical Sciences,University of Tokyo
発表年月日 1999/8/5
資料番号 SP99-56
巻番号(vol) vol.99
号番号(no) 255
ページ範囲 pp.-
ページ数 8
発行日