講演名 2022-03-08
健常音声からの声質変換と多数話者ボコーダによる構音障害話者の明瞭な音声合成の検討
高野 哲朗(HTS), 能勢 隆(東北大), 金垣 葵(東北大), 渡辺 聡(HTS),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 健常話者の音声から構音障害話者の音声へと声質変換することにより,障害話者の声色を維持しつつ聞き取りやすい合成音声を生成する検討を行った.少量の障害話者データであっても鮮明な音声が得られる多数話者ボコーダを利用し,話速変換による本人性の向上や,音高拡張による抑揚の単調性の解消,ファインチューニングによる単語データのみの学習でその有効性を示した.
抄録(英) In this study, we investigated the possibility of generating intelligible synthetic speech by converting the voice of a normal speaker to that of a dysarthric speaker while maintaining the tone of the speaker's voice. Using the fact that a multi-speaker vocoder can produce clear synthetic voice even with a small amount of impaired speaker data, we demonstrated the effectiveness of speech rate conversion to improve voice similarity, pitch augmentation to overcome monotonicity of intonation, and fine tuning to learn with word data.
キーワード(和) 構音障害 / 声質変換 / 多数話者ボコーダ / CycleGAN / HiFi-GAN
キーワード(英) dysarthria / voice conversion / multi-speaker vocoder / CycleGAN / HiFi-GAN
資料番号 WIT2021-46
発行日 2022-03-01 (WIT)

研究会情報
研究会 WIT / IPSJ-AAC
開催期間 2022/3/8(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 聴覚・視覚障害者支援、一般
テーマ(英)
委員長氏名(和) 酒向 慎司(名工大)
委員長氏名(英) Shinji Sakou(Nagoya Inst. of Tech.)
副委員長氏名(和) 雨宮 智浩(東大)
副委員長氏名(英) Tomohiro Amemiya(Univ. of Tokyo)
幹事氏名(和) 半田 隆志(埼玉県産業技術総合センター) / 塩野目 剛亮(帝京大) / 宮城 愛美(筑波技術大)
幹事氏名(英) Takashi Handa(Saitama Industrial Tech. Center) / Takeaki Shionome(Teikyo Univ.) / Manabi Miyagi(Tsukuba Univ. of Tech.)
幹事補佐氏名(和) 細野 美奈子(産総研) / 菅野 亜紀(名大) / 小森 智康(NHK)
幹事補佐氏名(英) Minako Hosono(AIST) / Aki Sugano(Nagoya Univ.) / Tomoyasu Komori(NHK)

講演論文情報詳細
申込み研究会 Technical Committee on Well-being Information Technology / Special Interest Group on Assistive & Accessible Computin
本文の言語 JPN
タイトル(和) 健常音声からの声質変換と多数話者ボコーダによる構音障害話者の明瞭な音声合成の検討
サブタイトル(和)
タイトル(英) A study on high-intelligibility speech synthesis of dysarthric speakers using voice conversion from normal speech and multi-speaker vocoder
サブタイトル(和)
キーワード(1)(和/英) 構音障害 / dysarthria
キーワード(2)(和/英) 声質変換 / voice conversion
キーワード(3)(和/英) 多数話者ボコーダ / multi-speaker vocoder
キーワード(4)(和/英) CycleGAN / CycleGAN
キーワード(5)(和/英) HiFi-GAN / HiFi-GAN
第 1 著者 氏名(和/英) 高野 哲朗 / Tetsuro Takano
第 1 著者 所属(和/英) 株式会社ヒューマンテクノシステム(略称:HTS)
Human Techno System Co., Ltd(略称:HTS)
第 2 著者 氏名(和/英) 能勢 隆 / Takashi Nose
第 2 著者 所属(和/英) 東北大学(略称:東北大)
Tohoku University(略称:Tohoku Univ.)
第 3 著者 氏名(和/英) 金垣 葵 / Aoi Kanagaki
第 3 著者 所属(和/英) 東北大学(略称:東北大)
Tohoku University(略称:Tohoku Univ.)
第 4 著者 氏名(和/英) 渡辺 聡 / Satoshi Watanabe
第 4 著者 所属(和/英) 株式会社ヒューマンテクノシステム(略称:HTS)
Human Techno System Co., Ltd(略称:HTS)
発表年月日 2022-03-08
資料番号 WIT2021-46
巻番号(vol) vol.121
号番号(no) WIT-418
ページ範囲 pp.18-23(WIT),
ページ数 6
発行日 2022-03-01 (WIT)