聴覚情景分析に基づく音声分離の逐次処理モデルの提案

中西 功; 花田 純一; 馬場 美咲

講演名	2015-09-03 聴覚情景分析に基づく音声分離の逐次処理モデルの提案中西功(鳥取大), 花田純一(鳥取大), 馬場美咲(鳥取大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	聴覚情景解析（ASA）に基づく音声分離を逐次（実時間）処理で実現することを試みている．混合音を変形DFTにより逐次・並列的に周波数毎の信号に分解し，分解後の信号からASAの４つの特徴を抽出し，それぞれの音に分解，分解成分毎に再合成（グルーピング）することで混合音を分離する．今回，調波構造の特徴によるグルーピングを柱に，その他の特徴を補助的に用いるモデルを提案し，音声信号を用いたシミュレーション実験によりその実現性を評価したので報告する．
抄録(英)	Speech separation based on auditory scene analysis (ASA) has been widely studied. We propose a processing method of the ASA, in which a mixed signal is sequentially decomposed into frequency signals, four types of features of ASA are extracted from the decomposed frequency signals, the decomposed signals are regrouped by examining the characteristics of the extracted features, and separated speeches are obtained by recomposing the regrouped frequency signals. In this paper, we implement a speech separation model in which the harmonic structure feature has a main role in grouping and the other features are used complementary. The feasibility of the proposed model is confirmed in a simulation.
キーワード(和)	音声分離 / 聴覚情景解析 / CASA / 逐次処理実現 / 変形DFT対
キーワード(英)	Speech Separation / Auditory Scene Analysis / Computational ASA / Sequential Implementation / Modified DFT Pair
資料番号	SIS2015-16
発行日	2015-08-27 (SIS)

研究会情報
研究会	SIS / IPSJ-AVM
開催期間	2015/9/3(から2日開催)
開催地（和）	関西大学千里山キャンパス
開催地（英）	Kansai Univ.
テーマ（和）	知的マルチメディアシステム，一般
テーマ（英）	Smart Multimedia Systems, etc.
委員長氏名（和）	棟安実治(関西大) / 亀山渉(早大)
委員長氏名（英）	Mitsuji Muneyasu(Kansai Univ.) / Wataru Kameyama(Waseda Univ.)
副委員長氏名（和）	田中宏和(広島市大) / 仲地孝之(NTT)
副委員長氏名（英）	Hirokazu Tanaka(Hiroshima City Univ.) / Takayuki Nakachi(NTT)
幹事氏名（和）	田中豪(名古屋市大) / 原田康祐(東芝) / 石井大祐(早大) / 井上雅之(ＮＴＴ) / 加藤晴久(KDDI)
幹事氏名（英）	Go Tanaka(Nagoya City Univ.) / Kosuke Harada(Toshiba) / Daisuke Ishii(Waseda Univ.) / Masayuki Inoue(ＮＴＴ) / Haruhisa Kato(KDDI)
幹事補佐氏名（和）	辻裕之(神奈川工科大) / 田向権(九工大)
幹事補佐氏名（英）	Hiroyuki Tsuji(Kanagawa Inst. of Tech.) / Hakaru Tamukoh(Kyushu Inst. of Tech.)

講演論文情報詳細
申込み研究会	Technical Committee on Smart Info-Media System / Special Interest Group on Audio Visual and Multimedia Information Processing
本文の言語	JPN
タイトル（和）	聴覚情景分析に基づく音声分離の逐次処理モデルの提案
サブタイトル（和）
タイトル（英）	A Sequential Processing Model for Speech Separation Based on Auditory Scene Analysis
サブタイトル（和）
キーワード(1)（和/英）	音声分離 / Speech Separation
キーワード(2)（和/英）	聴覚情景解析 / Auditory Scene Analysis
キーワード(3)（和/英）	CASA / Computational ASA
キーワード(4)（和/英）	逐次処理実現 / Sequential Implementation
キーワード(5)（和/英）	変形DFT対 / Modified DFT Pair
第 1 著者氏名（和/英）	中西功 / Isao Nakanishi
第 1 著者所属（和/英）	鳥取大学(略称：鳥取大) Tottori University(略称：Tottori Univ.)
第 2 著者氏名（和/英）	花田純一 / Junichi Hanada
第 2 著者所属（和/英）	鳥取大学(略称：鳥取大) Tottori University(略称：Tottori Univ.)
第 3 著者氏名（和/英）	馬場美咲 / Misaki Baba
第 3 著者所属（和/英）	鳥取大学(略称：鳥取大) Tottori University(略称：Tottori Univ.)
発表年月日	2015-09-03
資料番号	SIS2015-16
巻番号（vol）	vol.115
号番号（no）	SIS-208
ページ範囲	pp.7-12(SIS),
ページ数	6
発行日	2015-08-27 (SIS)