講演抄録/キーワード |
講演名 |
2020-03-03 09:00
朗読音声を用いたノンパラレル声質変換による変換音声の話者性と表現の評価 ○永瀬亮太郎・井本桂右・山西良典・山下洋一(立命館大) EA2019-138 SIP2019-140 SP2019-87 |
抄録 |
(和) |
現在の声質変換の技術において, 感情や抑揚,間の取り方などの多様な表現の再現は課題の1つとして研究されている.しかしながら,多様な表現に応じてパラレルな音声データを十分に収集することは容易ではない.本研究では,多様な表現を含むノンパラレルな音声として朗読音声に注目し, ノンパラレルな声質変換を行った.変換音声について,どの程度音声に含まれる話者性と多様な表現の変換が可能であるかを主観評価実験により評価した. |
(英) |
In the technology of voice conversion, reproduction of emotion and intonation, pause is one of the research issues. However, it is not easy to collect enough parallel speech data with various expressions. In this paper, we used non-parallel narrative speech data as expressive speech data for training and conducted the subjective evaluation of synthesized speech on personality and expression. |
キーワード |
(和) |
朗読音声 / ノンパラレルなデータセット / 声質変換 / StarGAN / / / / |
(英) |
Narrative Speech / Non-parallel dataset / Voice Conversion / StarGAN / / / / |
文献情報 |
信学技報, vol. 119, no. 441, SP2019-87, pp. 213-218, 2020年3月. |
資料番号 |
SP2019-87 |
発行日 |
2020-02-24 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2019-138 SIP2019-140 SP2019-87 |
|