大会名称
2019年 ソサイエティ大会
大会コ-ド
2019S
開催年
2019
発行日
2019/8/27
セッション番号
A-5
セッション名
応用音響
講演日
2019/9/13
講演場所(会議室等)
C棟 2F C201講義室
講演番号
A-5-4
タイトル
複数話者音声分離向けラダー型オートエンコーダの聴覚音声特徴量スパース性に対する再構成音声品質
著者名
○△関口 浩成末義哲森川博之
キーワード
音声分離, スパース性, 聴覚音声特徴量抽出, ラダーネットワーク, 聴覚脳神経学
抄録
霊長類が持つ,同時に発声する外部音源を聴覚脳神経系で聞き分ける能力は,聴覚音声特徴量抽出と時間同期性検知クラスタリングの2つの機能で構成される,時間同期性検知クラスタリングにおける包絡成分の時間推移の類似性に基づく音源の同一性判定が,聴覚脳神経系における聴覚情景物体生成の成否を決定する.そのためは,聴覚音声特徴量が互いに独立である必要性を示した.本研究ではその聴覚音声特徴量抽出をラダー型オートエンコーダ(LDAE)で実現し,その聴覚音声特徴抽出特性が再構成音声品質特性に及ぼす影響を評価する. 聴覚音声特徴抽出特性の尺度としてLDAEのエンコーダ出力間の集団スパースをとる.再構成音声品質特性の尺度としてはオリジナル入力音声と再構成音声間の SDR をとる. LDAE のハイパーパラメータを振って、種々の集団スパース性を実現したとき,広いスパース範囲で、再構成音声品質の特性が安定した.
本文pdf
PDF download   

PayPerView