講演名 2022-10-13
音声自然性改善に向けた音声強調ネットワークに対するカプセル構造の導入
春日 玲人(埼玉大), 島村 徹也(埼玉大), 杉浦 陽介(埼玉大), 安井 希子(埼玉大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声強調の分野は世界中で幅広く研究が行われているが,音声信号処理で扱われる基本的な量の中で,振幅や周波数などに比べ,位相は軽視される傾向にある.これは人間の聴覚は位相の変化に鈍感であるという認識から,位相の音声品質への寄与は少ないと考えられていたためである.しかし音声信号処理の発展とともに,音声品質に対する位相の重要性が明らかにされた.本論文では,近年画像認識の分野において優れた性能を発揮しているCapsule Networkのカプセル構造を音声強調ネットワークに導入し,位相情報にも着目した音声強調モデルを構築することで,音声強調ネットワークの性能改善,及び音声自然性の改善を試みる.
抄録(英) Although the field of speech enhancement has been extensively studied around the world, phase tends to be neglected compared to amplitude and frequency among the basic quantities handled in speech signal processing. This is because it was believed that the contribution of phase to speech quality was small, based on the perception that human hearing is insensitive to changes in phase. However, with the development of speech signal processing, the importance of phase to speech quality has become clear. In this paper, we introduce the capsule structure of the Capsule Network, which has shown excellent performance in the field of image recognition in recent years, to the speech enhancement network, and attempt to improve the performance of the speech enhancement network and the naturalness of speech by constructing a speech enhancement model that also focuses on phase information.
キーワード(和) 音声強調 / 位相 / 音声品質 / Capsule Network / カプセル構造 / 音声自然性
キーワード(英) speech enhancement / phase / speech quality / Capsule Network / capsule structure / naturalness of speech
資料番号 SIS2022-12
発行日 2022-10-06 (SIS)

研究会情報
研究会 SIS / ITE-BCT
開催期間 2022/10/13(から2日開催)
開催地(和) 八戸工業大学(1号館2階201室「多目的ホール」)
開催地(英) Hachinohe Institute of Technology
テーマ(和) システム実現技術, 近距離通信応用システム, 知的マルチメディア処理システム,放送技術および一般
テーマ(英)
委員長氏名(和) 木村 誠聡(神奈川工科大) / 斎藤 恭一(NHK)
委員長氏名(英) Tomoaki Kimura(Kanagawa Inst. of Tech.) / 斎藤 恭一(NHK)
副委員長氏名(和) 笹岡 直人(鳥取大) / 田向 権(九州工大) / 村田 英一(山口大) / 斉藤 一(テレビ東京)
副委員長氏名(英) Naoto Sasaoka(Tottori Univ.) / Hakaru Tamukoh(Kyushu Inst. of Tech.) / 村田 英一(山口大) / 斉藤 一(テレビ東京)
幹事氏名(和) 坂東 幸浩(NTT) / 吉田 壮(関西大学) / 齊藤 一幸(千葉大)
幹事氏名(英) Yukihiro Bandoh(NTT) / Soh Yoshida(Kansai Univ.) / 齊藤 一幸(千葉大)
幹事補佐氏名(和) 眞壁 義明(神奈川工科大) / 杉浦 陽介(埼玉大) / 神原 浩平(NHK) / 鈴村 高幸(テレビ朝日) / 松﨑 敬文(NHK) / 宮野 真由子(東芝インフラシステムズ) / 大内 幹博(パナソニック) / 榎 芳栄(TBSテレビ) / 水本 哲弥(日本学術振興会)
幹事補佐氏名(英) Yoshiaki Makabe(Kanagawa Inst. of Tech.) / Yosuke Sugiura(Saitama Univ.) / 神原 浩平(NHK) / 鈴村 高幸(テレビ朝日) / 松﨑 敬文(NHK) / 宮野 真由子(東芝インフラシステムズ) / 大内 幹博(パナソニック) / 榎 芳栄(TBSテレビ) / 水本 哲弥(日本学術振興会)

講演論文情報詳細
申込み研究会 Technical Committee on Smart Info-Media Systems / Technical Group on Broadcasting Technology
本文の言語 JPN
タイトル(和) 音声自然性改善に向けた音声強調ネットワークに対するカプセル構造の導入
サブタイトル(和)
タイトル(英) Toward Improving Speech Naturalness Introducing a Capsule Structure for Speech Enhancement Networks
サブタイトル(和)
キーワード(1)(和/英) 音声強調 / speech enhancement
キーワード(2)(和/英) 位相 / phase
キーワード(3)(和/英) 音声品質 / speech quality
キーワード(4)(和/英) Capsule Network / Capsule Network
キーワード(5)(和/英) カプセル構造 / capsule structure
キーワード(6)(和/英) 音声自然性 / naturalness of speech
第 1 著者 氏名(和/英) 春日 玲人 / Reito Kasuga
第 1 著者 所属(和/英) 埼玉大学(略称:埼玉大)
Saitama University(略称:Saitama Univ.)
第 2 著者 氏名(和/英) 島村 徹也 / Tetsuya Shimamura
第 2 著者 所属(和/英) 埼玉大学(略称:埼玉大)
Saitama University(略称:Saitama Univ.)
第 3 著者 氏名(和/英) 杉浦 陽介 / Yosuke Sugiura
第 3 著者 所属(和/英) 埼玉大学(略称:埼玉大)
Saitama University(略称:Saitama Univ.)
第 4 著者 氏名(和/英) 安井 希子 / Nozomiko Yasui
第 4 著者 所属(和/英) 埼玉大学(略称:埼玉大)
Saitama University(略称:Saitama Univ.)
発表年月日 2022-10-13
資料番号 SIS2022-12
巻番号(vol) vol.122
号番号(no) SIS-209
ページ範囲 pp.7-12(SIS),
ページ数 6
発行日 2022-10-06 (SIS)