大会名称 |
---|
2019年 ソサイエティ大会 |
大会コ-ド |
2019S |
開催年 |
2019 |
発行日 |
2019/8/27 |
セッション番号 |
A-5 |
セッション名 |
応用音響 |
講演日 |
2019/9/13 |
講演場所(会議室等) |
C棟 2F C201講義室 |
講演番号 |
A-5-4 |
タイトル |
複数話者音声分離向けラダー型オートエンコーダの聴覚音声特徴量スパース性に対する再構成音声品質 |
著者名 |
○△関口 浩, 成末義哲, 森川博之, |
キーワード |
音声分離, スパース性, 聴覚音声特徴量抽出, ラダーネットワーク, 聴覚脳神経学 |
抄録 |
霊長類が持つ,同時に発声する外部音源を聴覚脳神経系で聞き分ける能力は,聴覚音声特徴量抽出と時間同期性検知クラスタリングの2つの機能で構成される,時間同期性検知クラスタリングにおける包絡成分の時間推移の類似性に基づく音源の同一性判定が,聴覚脳神経系における聴覚情景物体生成の成否を決定する.そのためは,聴覚音声特徴量が互いに独立である必要性を示した.本研究ではその聴覚音声特徴量抽出をラダー型オートエンコーダ(LDAE)で実現し,その聴覚音声特徴抽出特性が再構成音声品質特性に及ぼす影響を評価する. 聴覚音声特徴抽出特性の尺度としてLDAEのエンコーダ出力間の集団スパースをとる.再構成音声品質特性の尺度としてはオリジナル入力音声と再構成音声間の SDR をとる. LDAE のハイパーパラメータを振って、種々の集団スパース性を実現したとき,広いスパース範囲で、再構成音声品質の特性が安定した. |
本文pdf |
PDF download
|