電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2019-03-15 13:30
[ポスター講演]重畳音声分離向け聴覚音声特徴量抽出のためのラダー型デノイジングスパースオートエンコーダの実装設計と評価
関口 浩成末義哲森川博之東大
技報オンラインサービス実施中
抄録 (和) 霊長類や哺乳類が外界の重畳音を聞き分ける際には,聴覚神経系において時間推移の類似性が高い聴覚音声特徴量包絡群を同一の音源と判断する時間同期検知クラスタリングが重要な役割を担っている.この時間同期検知クラスタリングが適切に機能するための要件は,聴覚音声特徴量抽出が互いに確率的に独立な信号群を生成すること,種々の外界音を特徴量に変換可能な非線形性を有することの2点である.本稿では,この2つの要件を実現する聴覚音声特徴量抽出の数理モデル,実装,および特性評価について述べる.数理モデルには,非線形スパースエンコーダデコーダモデルを選択し,その実装には,ラダー型デノイジングスパースオートエンコーダ(LDAE)を使用する.音声で学習させたLDAEネットワークにテスト用音声を入力し,その出力である聴覚音声特徴量の発生確率が互いに独立であることを示す. 
(英) Primates and mammalian distinguish overlapped speech sounds from one another by recognizing a single sound source whether temporal contour of auditory speech features in auditory neurons are similar.This is called as temporal synchronization detection and clustering function. The performance of this detection and clustering function depends on the former function that is auditory speech feature extraction. The feature extraction is needed to satisfy two requirements: 1) auditory speech features are mutually stochastic independent and 2) the feature extraction should allow various complicated sounds to be represented, which leads to non-linearity.This paper introduces non-linear sparse encoder decoder model as computational model, implements it with a ladder network, and finally evaluate that network behavior. We show that our trained network can output auditory speech features that are mutually stochastic independent.
キーワード (和) ラダーネットワーク / 音声分離 / 聴覚脳神経学 / 聴覚音声特徴量抽出 / 確率論的独立性 / / /  
(英) Ladder Network / Speech Separation / Auditory Neuroscience / Auditory Speech Feature Extraction / stochastic independence / / /  
文献情報 信学技報, vol. 118, no. 497, SP2018-117, pp. 329-333, 2019年3月.
資料番号 SP2018-117 
発行日 2019-03-07 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 EA SIP SP  
開催期間 2019-03-14 - 2019-03-15 
開催地(和) アイランド ナガサキ(長崎市) 
開催地(英) i+Land nagasaki (Nagasaki-shi) 
テーマ(和) 応用/電気音響,信号処理,音声,一般 
テーマ(英) Engineering/Electro Acoustics, Signal Processing, Speech, and Related Topics 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2019-03-EA-SIP-SP 
本文の言語 日本語 
タイトル(和) 重畳音声分離向け聴覚音声特徴量抽出のためのラダー型デノイジングスパースオートエンコーダの実装設計と評価 
サブタイトル(和)  
タイトル(英) Design and Evaluation of Ladder Denoising Autoencoder for Auditory Speech Feature Extraction of Overlapped Speech Separation 
サブタイトル(英)  
キーワード(1)(和/英) ラダーネットワーク / Ladder Network  
キーワード(2)(和/英) 音声分離 / Speech Separation  
キーワード(3)(和/英) 聴覚脳神経学 / Auditory Neuroscience  
キーワード(4)(和/英) 聴覚音声特徴量抽出 / Auditory Speech Feature Extraction  
キーワード(5)(和/英) 確率論的独立性 / stochastic independence  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 関口 浩 / Hiroshi Sekiguchi / セキグチ ヒロシ
第1著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo)
第2著者 氏名(和/英/ヨミ) 成末 義哲 / Yoshiaki Narusue / ナルスエ ヨシアキ
第2著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo)
第3著者 氏名(和/英/ヨミ) 森川 博之 / Hiroyuki Morikawa / モリカワ ヒロユキ
第3著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2019-03-15 13:30:00 
発表時間 90 
申込先研究会 SP 
資料番号 IEICE-EA2018-155,IEICE-SIP2018-161,IEICE-SP2018-117 
巻番号(vol) IEICE-118 
号番号(no) no.495(EA), no.496(SIP), no.497(SP) 
ページ範囲 pp.329-333 
ページ数 IEICE-5 
発行日 IEICE-EA-2019-03-07,IEICE-SIP-2019-03-07,IEICE-SP-2019-03-07 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会