講演名 2022-03-02
[ポスター講演]球波動関数展開を用いた深層学習による少数測定データからの頭部伝達関数補間
伊藤 悠貴(東大), 中村 友彦(東大), 小山 翔一(東大), 猿渡 洋(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 臨場感のあるバイノーラル信号を合成するためには受聴者本人の頭部伝達関数(head-related transfer function: HRTF)を用いることが望ましい.HRTFの計測には時間がかかるため,少数の観測からHRTFを補間できればより簡便な測定で済み利便性が向上する.従来の球波動関数展開によるHRTF補間方法では任意音源位置のHRTFを簡便に補間できるものの,観測点が少なくなるに従い補間性能が低下する傾向にあった.そこで本稿では,球波動関数展開によるHRTFの表現方法とメタ学習を組み合わせた,深層学習に基づく少数観測点からのHRTF補間手法を提案する.メタ学習では少数観測点から補間を行う状況を模倣して深層ニューラルネットワークを訓練するため,提案法は観測点数が少ない場合でも安定して動作できる.HRTF補間実験により,提案法は観測点数が少ない場合に従来法よりも高精度に補間が可能であることを示した.
抄録(英) In binaural synthesis, listeners' individual head-related transfer functions (HRTFs) are necessary for highly-immersive spatial audio. Since HRTF measurement is generally time-consuming, it will be helpful if high-resolution HRTFs are interpolated from a small number of HRTFs obtained by a simple measurement procedure. One of the established HRTF interpolation methods is the method based on spherical wavefunction expansion, which allows estimating HRTFs at arbitrary direction and distance in a simple manner; however, its interpolation accuracy deteriorates as the number of measurements decreases. We propose a deep-neural-network (DNN)-based HRTF interpolation method combining the representation using spherical wavefunction expansion and meta-learning. Since meta-learning simulates the process of interpolation from a small number of measurements to learn DNN using training data, the proposed method will stably estimate HRTFs even when the number of measurements is insufficient. Experimental results indicated that the proposed method achieves high interpolation accuracy compared with the current method when the number of measurements is small.
キーワード(和) 頭部伝達関数 / 頭部伝達関数補間 / 深層学習 / メタ学習 / few-shot learning / 球波動関数展開
キーワード(英) head-related transfer functions / HRTF interpolation / deep learning / meta-learning / few-shot learning / spherical wavefunction expansion
資料番号 EA2021-90,SIP2021-117,SP2021-75
発行日 2022-02-22 (EA, SIP, SP)

研究会情報
研究会 EA / SIP / SP / IPSJ-SLP
開催期間 2022/3/1(から2日開催)
開催地(和) 沖縄県立博物館・美術館
開催地(英)
テーマ(和) 応用/電気音響, 信号処理,音声,一般
テーマ(英)
委員長氏名(和) 梶川 嘉延(関西大) / 坂東 幸浩(NTT) / 北岡 教英(豊橋技科大) / 北岡 教英(豊橋技科大)
委員長氏名(英) Yoshinobu Kajikawa(Kansai Univ.) / Yukihiro Bandou(NTT) / Norihide Kitaoka(Toyohashi Univ. of Tec) / 北岡 教英(豊橋技科大)
副委員長氏名(和) 古家 賢一(大分大) / 小山 翔一(東大) / 田中 聡久(東京農工大) / 仲地 孝之(琉球大学)
副委員長氏名(英) Kenichi Furuya(Oita Univ.) / Shoichi Koyama(Univ. of Tokyo) / Toshihisa Tanaka(Tokyo Univ. Agri.&Tech.) / Takayuki Nakachi(Ryukyu Univ.)
幹事氏名(和) 加古 達也(NTT) / 西浦 敬信(立命館大) / 杉本 憲治郎(Xiaomi) / 渡辺 修(拓殖大) / 田中 雄一(東京農工大) / 高道 慎之介(東大) / 高島 遼一(神戸大) / 高道 慎之介(東大) / 高島 遼一(神戸大) / 中鹿 亘(電通大) / 増村 亮(NTT)
幹事氏名(英) Tatsuya Kako(NTT) / Takanobu Nishiura(RitsumeikanUniv.) / Kenjiro Sugimoto(Xiaomi) / Osamu Watanabe(Takushoku Univ.) / Yuichi Tanaka(Tokyo Univ. Agri.&Tech.) / Shinnosuke Takamichi(Univ. of Tokyo) / Ryouichi Takashima(Kobe Univ.) / 高道 慎之介(東大) / 高島 遼一(神戸大) / 中鹿 亘(電通大) / 増村 亮(NTT)
幹事補佐氏名(和) 若林 佑幸(都立大) / 小松 達也(LINE) / 吉田 太一(電通大) / 京地 清介(北九州市立大) / 中鹿 亘(電通大) / 増村 亮(NTT)
幹事補佐氏名(英) Yukou Wakabayashi(Tokyo Metropolitan Univ.) / Tatsuya Komatsu(LINE) / Taichi Yoshida(UEC) / Seisuke Kyochi(Univ. of Kitakyushu) / Toru Nakashika(Univ. of Electro-Comm.) / Ryo Masumura(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Technical Committee on Signal Processing / Technical Committee on Speech / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) [ポスター講演]球波動関数展開を用いた深層学習による少数測定データからの頭部伝達関数補間
サブタイトル(和)
タイトル(英) [Poster Presentation] Interpolation of head-related transfer function from small amount of observation data using deep learning based on spherical wavefunction expansion
サブタイトル(和)
キーワード(1)(和/英) 頭部伝達関数 / head-related transfer functions
キーワード(2)(和/英) 頭部伝達関数補間 / HRTF interpolation
キーワード(3)(和/英) 深層学習 / deep learning
キーワード(4)(和/英) メタ学習 / meta-learning
キーワード(5)(和/英) few-shot learning / few-shot learning
キーワード(6)(和/英) 球波動関数展開 / spherical wavefunction expansion
第 1 著者 氏名(和/英) 伊藤 悠貴 / Yuki Ito
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 2 著者 氏名(和/英) 中村 友彦 / Tomohiko Nakamura
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 3 著者 氏名(和/英) 小山 翔一 / Shoichi Koyama
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 4 著者 氏名(和/英) 猿渡 洋 / Hiroshi Saruwatari
第 4 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
発表年月日 2022-03-02
資料番号 EA2021-90,SIP2021-117,SP2021-75
巻番号(vol) vol.121
号番号(no) EA-383,SIP-384,SP-385
ページ範囲 pp.163-170(EA), pp.163-170(SIP), pp.163-170(SP),
ページ数 8
発行日 2022-02-22 (EA, SIP, SP)