講演抄録/キーワード |
講演名 |
2021-03-03 14:05
[ポスター講演]大規模主観評価に基づく定量的音読スキル情報を活用したDNN音声合成の検討 ○阿久井 駿(東大)・井島勇祐(NTT)・齋藤大輔・峯松信明(東大) EA2020-71 SIP2020-102 SP2020-36 |
抄録 |
(和) |
これまで我々は,プロのアナウンサーらしさを反映する定量的な尺度として,主観評価実験に基づいた「音読スキル」と呼ばれる指標を検討してきた.本稿では,こうした定量的音読スキル情報をDNN音声合成に活用し,DNNの入力情報として音読スキルの値を付加して複数話者による学習を行う方法を検討する.これにより,音声の話者性は保ったまま音読スキルを操作できることが期待される.合成した音声が自然性や話者再現性を保持したまま音読スキルの変化を示しているかどうか,および音読スキル値を入力する隠れ層を変更した場合の性能について,客観評価および聴取実験による主観評価で検討した. |
(英) |
So far, we have been suggested the value of `oral reading skill' based on a listening evaluation experiment as a quantitative index which represents how much the reading voice is heard as a professional narrator's one. In this paper, we attempt to utilize such information of skill for DNN-based speech synthesis by adding the value of oral reading skill to the input of the multispeaker DNN speech synthesis model. This can be expected to manipulate the reading skill of synthesized voice without changing its individuality. We considered different patterns of hidden layers the value of oral reading skill is added to. For each case, we discussed by objective evaluation and subjective evaluation based on listening experiment whether the reading skill of the synthesized voice changes as expected with its naturalness and individuality preserved. |
キーワード |
(和) |
音声合成 / 深層ニューラルネットワーク / 音読スキル / / / / / |
(英) |
speech synthesis / deep neural network / oral reading skill / / / / / |
文献情報 |
信学技報, vol. 120, no. 399, SP2020-36, pp. 68-73, 2021年3月. |
資料番号 |
SP2020-36 |
発行日 |
2021-02-24 (EA, SIP, SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2020-71 SIP2020-102 SP2020-36 |
研究会情報 |
研究会 |
EA US SP SIP IPSJ-SLP |
開催期間 |
2021-03-03 - 2021-03-04 |
開催地(和) |
オンライン開催 |
開催地(英) |
Online |
テーマ(和) |
音声,応用/電気音響,信号処理,超音波,一般 |
テーマ(英) |
Speech, Engineering/Electro Acoustics, Signal Processing, Ultrasonics, and Related Topics |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2021-03-EA-US-SP-SIP-SLP |
本文の言語 |
日本語 |
タイトル(和) |
大規模主観評価に基づく定量的音読スキル情報を活用したDNN音声合成の検討 |
サブタイトル(和) |
|
タイトル(英) |
Investigation of DNN-based speech synthesis utilizing oral reading skills obtained from large scale subjective evaluation |
サブタイトル(英) |
|
キーワード(1)(和/英) |
音声合成 / speech synthesis |
キーワード(2)(和/英) |
深層ニューラルネットワーク / deep neural network |
キーワード(3)(和/英) |
音読スキル / oral reading skill |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
阿久井 駿 / Shun Akui / アクイ シュン |
第1著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo) |
第2著者 氏名(和/英/ヨミ) |
井島 勇祐 / Yusuke Ijima / イジマ ユウスケ |
第2著者 所属(和/英) |
日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT) |
第3著者 氏名(和/英/ヨミ) |
齋藤 大輔 / Daisuke Saito / サイトウ ダイスケ |
第3著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo) |
第4著者 氏名(和/英/ヨミ) |
峯松 信明 / Nobuaki Minematsu / ミネマツ ノブアキ |
第4著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2021-03-03 14:05:00 |
発表時間 |
90分 |
申込先研究会 |
SP |
資料番号 |
EA2020-71, SIP2020-102, SP2020-36 |
巻番号(vol) |
vol.120 |
号番号(no) |
no.397(EA), no.398(SIP), no.399(SP) |
ページ範囲 |
pp.68-73 |
ページ数 |
6 |
発行日 |
2021-02-24 (EA, SIP, SP) |
|