講演名 2022-06-18
[招待講演]Crazy vocoderは砕けない
森勢 将雅(明大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 現在の音声合成研究者が論文にVocoderと記載するとき,その多くはDeep neural network (DNN)を用いて何らかのパラメータから高品質な音声波形を生成するNeural vocoderを指すのではないだろうか.もしそうであれば,音声符号化という役割ではなく,高品質な音声を合成したいという高品質Vocoderが持つ『黄金の精神』が,Neural vocoder世代に受け継がれたことを意味する.本稿では,恐らく今後失われていくであろう伝統的なVocoderの波形生成部のアルゴリズム,および一連の知識がまだ音声研究において役立つかという将来展望について紹介する.
抄録(英) When current speech synthesis researchers refer to Vocoder in their papers, they are most likely referring to Neural vocoder, which generates high-quality speech from parameters by using deep neural networks (DNN). If so, the "golden spirit" of a high-quality vocoder, which is to synthesize high-quality speech rather than play the role of speech encoding, has been passed on to the Neural vocoder generation. This paper presents the core algorithms in the waveform generation of traditional vocoder, which will probably be lost in the future, and prospects for how this body of knowledge can still be useful in speech research.
キーワード(和) 音声合成 / Vocoder / テキスト音声合成 / 声質変換 / 音声デザイン
キーワード(英) Speech synthesis / Vocoder / Text-to-speech synthesis / Voice conversion / Speech design
資料番号 SP2022-15
発行日 2022-06-10 (SP)

研究会情報
研究会 SP / IPSJ-MUS / IPSJ-SLP
開催期間 2022/6/17(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 音学シンポジウム2022
テーマ(英)
委員長氏名(和) 戸田 智基(名大)
委員長氏名(英) Tomoki Toda(Nagoya Univ.)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和) 増村 亮(NTT) / 中鹿 亘(電通大)
幹事氏名(英) Ryo Masumura(NTT) / Toru Nakashika(Univ. of Electro-Comm.)
幹事補佐氏名(和) 相原 龍(三菱電機) / 齋藤 大輔(東大)
幹事補佐氏名(英) Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Special Interest Group on Music and Computer / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) [招待講演]Crazy vocoderは砕けない
サブタイトル(和) でもちょっとくだけた未来の話を
タイトル(英) [Invited Talk] Crazy vocoder is unbreakable
サブタイトル(和) But let's talk about an informal vision of the future
キーワード(1)(和/英) 音声合成 / Speech synthesis
キーワード(2)(和/英) Vocoder / Vocoder
キーワード(3)(和/英) テキスト音声合成 / Text-to-speech synthesis
キーワード(4)(和/英) 声質変換 / Voice conversion
キーワード(5)(和/英) 音声デザイン / Speech design
第 1 著者 氏名(和/英) 森勢 将雅 / Masanori Morise
第 1 著者 所属(和/英) 明治大学(略称:明大)
Meiji University(略称:Meiji Univ.)
発表年月日 2022-06-18
資料番号 SP2022-15
巻番号(vol) vol.122
号番号(no) SP-81
ページ範囲 pp.61-66(SP),
ページ数 6
発行日 2022-06-10 (SP)