講演名 2024-03-11
条件付きVAEによる印象情報を反映した音色合成手法
吉川 美佑(名工大), 黒柳 奨(名工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音色と人間が抱く印象の関係性を体系立てて説明することは難しく,音色のデザインにおいては経験や感覚に大きく依存している側面が強い.この現状を踏まえ,条件付き変分オートエンコーダ(Conditional Variational Auto Encoder:CVAE)を用いて,人間が想起する印象による基づいた音色生成を行った.本稿では,表現される音色のバリエーションを広げることを目的とし,印象の想起には波形の振幅の時間的変化が重要であると考え,モデルの拡張を行った.具体的には,信号を倍音構成比により形成される波形と,振幅の時間的変化であるエンベロープ情報に分離し,学習を行った.本稿では被験者による聴取実験を行い,本提案手法の有効性を示した.
抄録(英) It is difficult to systematically explain the relationship between tones and the impressions people have of them. In this paper, we have used a conditional variational autoencoder (CVAE)to generate tones based on the impressions that humans evoke.We aim to expand the variation of tones represented, and the model was extended based on the idea that temporal changes in waveform amplitude are important for the recall of impressions. Therefore, we separated the model into a waveform formed by the overtone composition ratio and envelope information, which is the temporal variation of the amplitude, and each was learned by the CVAE. The effectiveness of the proposed method is demonstrated through listening experiments with subjects.
キーワード(和) 音色合成 / 条件付き変分自己符号化器 / 印象
キーワード(英) Timbre synthesis / Conditional variational autoencoder / Impression
資料番号 NC2023-49
発行日 2024-03-04 (NC)

研究会情報
研究会 NC / MBE
開催期間 2024/3/11(から2日開催)
開催地(和) 東京大学
開催地(英) The Univ. of Tokyo
テーマ(和) 脳アーキテクチャー, 一般(NC, ME)
テーマ(英) Brain architecture, General
委員長氏名(和) 田中 宏和(東京都市大) / 吉田 久(近畿大)
委員長氏名(英) Hirokazu Tanaka(Tokyo City Univ.) / Hisashi Yoshida(Kinki Univ.)
副委員長氏名(和) 井澤 淳(筑波大) / 植野 彰規(東京電機大)
副委員長氏名(英) Jun Izawa(Univ. of Tsukub) / Akinori Ueno(Tokyo Denki Univ.)
幹事氏名(和) 寺島 裕貴(NTT) / 田中 沙織(奈良先端大) / 前田 祐佳(筑波大) / 辛島 彰洋(東北工大)
幹事氏名(英) Hiroki Terashima(NTT) / Saori Tanaka(NAIST) / Yuka Maeda(Univ. of Tsukuba) / Akihiro Karashima(Tohoku Inst. of Tech.)
幹事補佐氏名(和) 田和辻 可昌(早大) / 堀井 隆斗(阪大) / 塚原 彰彦(東京電機大) / 金子 美樹(阪大)
幹事補佐氏名(英) Yoshimasa Tawatsuji(Waseda Univ.) / Takato Horii(Osaka Univ.) / Akihiko Tsukahara(Tokyo Denki Univ.) / Miki Kaneko(Osaka Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Neurocomputing / Technical Committee on ME and Bio Cybernetics
本文の言語 JPN
タイトル(和) 条件付きVAEによる印象情報を反映した音色合成手法
サブタイトル(和) 継時変化情報の応用
タイトル(英) A Method of Timbre Synthesis Reflecting Impression Using Conditional-VAE
サブタイトル(和) Applying the Temporal Information
キーワード(1)(和/英) 音色合成 / Timbre synthesis
キーワード(2)(和/英) 条件付き変分自己符号化器 / Conditional variational autoencoder
キーワード(3)(和/英) 印象 / Impression
第 1 著者 氏名(和/英) 吉川 美佑 / Miyu Yoshikawa
第 1 著者 所属(和/英) 名古屋工業大学(略称:名工大)
Nagoya Institute of Technology(略称:NIT)
第 2 著者 氏名(和/英) 黒柳 奨 / Susumu Kuroyanagi
第 2 著者 所属(和/英) 名古屋工業大学(略称:名工大)
Nagoya Institute of Technology(略称:NIT)
発表年月日 2024-03-11
資料番号 NC2023-49
巻番号(vol) vol.123
号番号(no) NC-418
ページ範囲 pp.37-42(NC),
ページ数 6
発行日 2024-03-04 (NC)