講演名 2022-03-02
アクセント潜在変数を用いた方言音声合成における文単位生成の評価
湯舟 航耶(東大), 郡山 知樹(東大), 高道 慎之介(東大), 猿渡 洋(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 日本語方言音声合成は個人化された音声合成システムなどにとって有用であるが,アクセントラベルを用意できないことが合成音声の自然性を高める上での障害となっている.著者らは過去,アクセントラベルなしで日本語方言のピッチアクセントを生成するため,vector quantized variational autoencoder (VQ-VAE) を用いて方言ピッチアクセントをモーラ単位のアクセント潜在変数としてモデル化する手法を提案し,フレーズ単位の発話に対して評価を行った.これに続き本稿では,修正した同様の手法を文単位の方言発話に適用し,その評価を行う.実験では,文単位発話に対してもアクセント潜在変数によって音声のピッチアクセントをモデル化できること,単語分割の精度が高い場合に提案法は従来法よりも自然なピッチアクセントをテキストから生成できること,提案法によって生成されるピッチアクセントの可制御性が向上することを示す.
抄録(英) Japanese dialect speech synthesis is useful for personalized speech synthesis systems. However, inability to prepare accent labels is an obstacle to improving the naturalness of the synthesized dialectal speeches. In the past, we proposed an accent-label-free method to model the pitch accent of Japanese dialects as mora-level accent latent variables (ALVs) using vector quantized variational autoencoder (VQ-VAE), and we evaluated its performance for phrase-level utterances. In this paper, we apply the same method with some modifications to sentence-level dialectal utterances and evaluate it. The experimental evaluation showed that the ALVs can be used to model the pitch accent even of sentence-level utterances, that the proposed method can synthesize more natural pitch accents from text than the conventional one when the text analysis is accurate, and that the proposed method improves the controllability of synthesized pitch accents.
キーワード(和) 方言音声合成 / アクセント潜在変数 / VQ-VAE / ピッチアクセント / 潜在変数
キーワード(英) Dialect speech synthesis / accent latent variable / VQ-VAE / pitch accent / latent variable
資料番号 EA2021-79,SIP2021-106,SP2021-64
発行日 2022-02-22 (EA, SIP, SP)

研究会情報
研究会 EA / SIP / SP / IPSJ-SLP
開催期間 2022/3/1(から2日開催)
開催地(和) 沖縄県立博物館・美術館
開催地(英)
テーマ(和) 応用/電気音響, 信号処理,音声,一般
テーマ(英)
委員長氏名(和) 梶川 嘉延(関西大) / 坂東 幸浩(NTT) / 北岡 教英(豊橋技科大) / 北岡 教英(豊橋技科大)
委員長氏名(英) Yoshinobu Kajikawa(Kansai Univ.) / Yukihiro Bandou(NTT) / Norihide Kitaoka(Toyohashi Univ. of Tec) / 北岡 教英(豊橋技科大)
副委員長氏名(和) 古家 賢一(大分大) / 小山 翔一(東大) / 田中 聡久(東京農工大) / 仲地 孝之(琉球大学)
副委員長氏名(英) Kenichi Furuya(Oita Univ.) / Shoichi Koyama(Univ. of Tokyo) / Toshihisa Tanaka(Tokyo Univ. Agri.&Tech.) / Takayuki Nakachi(Ryukyu Univ.)
幹事氏名(和) 加古 達也(NTT) / 西浦 敬信(立命館大) / 杉本 憲治郎(Xiaomi) / 渡辺 修(拓殖大) / 田中 雄一(東京農工大) / 高道 慎之介(東大) / 高島 遼一(神戸大) / 高道 慎之介(東大) / 高島 遼一(神戸大) / 中鹿 亘(電通大) / 増村 亮(NTT)
幹事氏名(英) Tatsuya Kako(NTT) / Takanobu Nishiura(RitsumeikanUniv.) / Kenjiro Sugimoto(Xiaomi) / Osamu Watanabe(Takushoku Univ.) / Yuichi Tanaka(Tokyo Univ. Agri.&Tech.) / Shinnosuke Takamichi(Univ. of Tokyo) / Ryouichi Takashima(Kobe Univ.) / 高道 慎之介(東大) / 高島 遼一(神戸大) / 中鹿 亘(電通大) / 増村 亮(NTT)
幹事補佐氏名(和) 若林 佑幸(都立大) / 小松 達也(LINE) / 吉田 太一(電通大) / 京地 清介(北九州市立大) / 中鹿 亘(電通大) / 増村 亮(NTT)
幹事補佐氏名(英) Yukou Wakabayashi(Tokyo Metropolitan Univ.) / Tatsuya Komatsu(LINE) / Taichi Yoshida(UEC) / Seisuke Kyochi(Univ. of Kitakyushu) / Toru Nakashika(Univ. of Electro-Comm.) / Ryo Masumura(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Technical Committee on Signal Processing / Technical Committee on Speech / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) アクセント潜在変数を用いた方言音声合成における文単位生成の評価
サブタイトル(和)
タイトル(英) Evaluation of sentence-level generation in Japanese dialect speech synthesis using accent latent variables
サブタイトル(和)
キーワード(1)(和/英) 方言音声合成 / Dialect speech synthesis
キーワード(2)(和/英) アクセント潜在変数 / accent latent variable
キーワード(3)(和/英) VQ-VAE / VQ-VAE
キーワード(4)(和/英) ピッチアクセント / pitch accent
キーワード(5)(和/英) 潜在変数 / latent variable
第 1 著者 氏名(和/英) 湯舟 航耶 / Kazuya Yufune
第 1 著者 所属(和/英) 東京大学(略称:東大)
the University of Tokyo(略称:UTokyo)
第 2 著者 氏名(和/英) 郡山 知樹 / Tomoki Koriyama
第 2 著者 所属(和/英) 東京大学(略称:東大)
the University of Tokyo(略称:UTokyo)
第 3 著者 氏名(和/英) 高道 慎之介 / Shinnosuke Takamichi
第 3 著者 所属(和/英) 東京大学(略称:東大)
the University of Tokyo(略称:UTokyo)
第 4 著者 氏名(和/英) 猿渡 洋 / Hiroshi Saruwatari
第 4 著者 所属(和/英) 東京大学(略称:東大)
the University of Tokyo(略称:UTokyo)
発表年月日 2022-03-02
資料番号 EA2021-79,SIP2021-106,SP2021-64
巻番号(vol) vol.121
号番号(no) EA-383,SIP-384,SP-385
ページ範囲 pp.96-101(EA), pp.96-101(SIP), pp.96-101(SP),
ページ数 6
発行日 2022-02-22 (EA, SIP, SP)