講演名 2015-09-03
聴覚情景分析に基づく音声分離の逐次処理モデルの提案
中西 功(鳥取大), 花田 純一(鳥取大), 馬場 美咲(鳥取大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 聴覚情景解析(ASA)に基づく音声分離を逐次(実時間)処理で実現することを試みている.混合音を変形DFTにより逐次・並列的に周波数毎の信号に分解し,分解後の信号からASAの4つの特徴を抽出し,それぞれの音に分解,分解成分毎に再合成(グルーピング)することで混合音を分離する.今回,調波構造の特徴によるグルーピングを柱に,その他の特徴を補助的に用いるモデルを提案し,音声信号を用いたシミュレーション実験によりその実現性を評価したので報告する.
抄録(英) Speech separation based on auditory scene analysis (ASA) has been widely studied. We propose a processing method of the ASA, in which a mixed signal is sequentially decomposed into frequency signals, four types of features of ASA are extracted from the decomposed frequency signals, the decomposed signals are regrouped by examining the characteristics of the extracted features, and separated speeches are obtained by recomposing the regrouped frequency signals. In this paper, we implement a speech separation model in which the harmonic structure feature has a main role in grouping and the other features are used complementary. The feasibility of the proposed model is confirmed in a simulation.
キーワード(和) 音声分離 / 聴覚情景解析 / CASA / 逐次処理実現 / 変形DFT対
キーワード(英) Speech Separation / Auditory Scene Analysis / Computational ASA / Sequential Implementation / Modified DFT Pair
資料番号 SIS2015-16
発行日 2015-08-27 (SIS)

研究会情報
研究会 SIS / IPSJ-AVM
開催期間 2015/9/3(から2日開催)
開催地(和) 関西大学千里山キャンパス
開催地(英) Kansai Univ.
テーマ(和) 知的マルチメディアシステム,一般
テーマ(英) Smart Multimedia Systems, etc.
委員長氏名(和) 棟安 実治(関西大) / 亀山 渉(早大)
委員長氏名(英) Mitsuji Muneyasu(Kansai Univ.) / Wataru Kameyama(Waseda Univ.)
副委員長氏名(和) 田中 宏和(広島市大) / 仲地 孝之(NTT)
副委員長氏名(英) Hirokazu Tanaka(Hiroshima City Univ.) / Takayuki Nakachi(NTT)
幹事氏名(和) 田中 豪(名古屋市大) / 原田 康祐(東芝) / 石井 大祐(早大) / 井上 雅之(NTT) / 加藤 晴久(KDDI)
幹事氏名(英) Go Tanaka(Nagoya City Univ.) / Kosuke Harada(Toshiba) / Daisuke Ishii(Waseda Univ.) / Masayuki Inoue(NTT) / Haruhisa Kato(KDDI)
幹事補佐氏名(和) 辻 裕之(神奈川工科大) / 田向 権(九工大)
幹事補佐氏名(英) Hiroyuki Tsuji(Kanagawa Inst. of Tech.) / Hakaru Tamukoh(Kyushu Inst. of Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Smart Info-Media System / Special Interest Group on Audio Visual and Multimedia Information Processing
本文の言語 JPN
タイトル(和) 聴覚情景分析に基づく音声分離の逐次処理モデルの提案
サブタイトル(和)
タイトル(英) A Sequential Processing Model for Speech Separation Based on Auditory Scene Analysis
サブタイトル(和)
キーワード(1)(和/英) 音声分離 / Speech Separation
キーワード(2)(和/英) 聴覚情景解析 / Auditory Scene Analysis
キーワード(3)(和/英) CASA / Computational ASA
キーワード(4)(和/英) 逐次処理実現 / Sequential Implementation
キーワード(5)(和/英) 変形DFT対 / Modified DFT Pair
第 1 著者 氏名(和/英) 中西 功 / Isao Nakanishi
第 1 著者 所属(和/英) 鳥取大学(略称:鳥取大)
Tottori University(略称:Tottori Univ.)
第 2 著者 氏名(和/英) 花田 純一 / Junichi Hanada
第 2 著者 所属(和/英) 鳥取大学(略称:鳥取大)
Tottori University(略称:Tottori Univ.)
第 3 著者 氏名(和/英) 馬場 美咲 / Misaki Baba
第 3 著者 所属(和/英) 鳥取大学(略称:鳥取大)
Tottori University(略称:Tottori Univ.)
発表年月日 2015-09-03
資料番号 SIS2015-16
巻番号(vol) vol.115
号番号(no) SIS-208
ページ範囲 pp.7-12(SIS),
ページ数 6
発行日 2015-08-27 (SIS)