講演抄録/キーワード |
講演名 |
2011-12-20 17:00
HMM音声合成のための動的特徴量を用いた音素継続長モデリングの検討 ○能勢 隆・小林隆夫(東工大) NLC2011-55 SP2011-100 |
抄録 |
(和) |
HMM音声合成における音素継続長の推定精度の改善を目的とし,
動的特徴量を用いた音素継続長のモデル化および生成手法を提案する.
継続長のモデル化については隠れセミマルコフモデル(HSMM)により
状態継続長を明示的にモデル化する手法が提案されているが,
音素継続長が直接モデル化されておらず,また音素間の継続長の
関係はコンテキストのみで表現されている.
提案法では,音素継続長を観測デ-タとみなし直接モデル化を行う.
モデル化の際には,音素間の継続長の相関を明示的に考慮するために
静的特徴量だけでなく音素継続長の動的特徴量も用いて学習を行う.
合成時には静的および動的特徴量を用いて音素継続長系列を生成することにより
音素間の継続長の相関を合成音声に反映させることが可能となる.
静的特徴量のみを用いた場合や対数継続長を用いた場合などとの
比較を行い,提案法の有効性を示す. |
(英) |
This paper proposes a technique for modeling and generating phone durations
using their dynamic features to improve prediction accuracy of phone durations in HMM-based speech synthesis.
For the duration modeling, a technique with explicit state-duration modeling
based on hidden semi-Markov model (HSMM) has been proposed.
However, the HSMM cannot directly model phone durations,
and the relation of phone durations among adjacent phonemes are represented only by context labels.
In the proposed technique, phone durations are regarded as observable data
obtained by manual labeling or forced alignment
and are directly modeled using single Gaussian distributions.
To explicitly take into account the correlation of phone durtions in the model training and speech synthesis,
we use not only static phone durations but also dynamic ones.
When synthesizing speech, we generate a phone-duration sequence from the trained duration models
using a parameter generation algorithm with static and dynamic features.
We evaluate the performance of our duration modeling technique
by comparing to other techniques with static or static log-duration features. |
キーワード |
(和) |
HMM音声合成 / 音素継続長 / 動的特徴量を考慮したパラメ-タ生成 / 隠れセミマルコフモデル / / / / |
(英) |
HMM-based speech synthesis / phone duration / parameter generation with dynamic features / hidden semi-Markov model (HSMM) / / / / |
文献情報 |
信学技報, vol. 111, no. 365, SP2011-100, pp. 197-202, 2011年12月. |
資料番号 |
SP2011-100 |
発行日 |
2011-12-12 (NLC, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2011-55 SP2011-100 |
研究会情報 |
研究会 |
SP NLC IPSJ-SLP |
開催期間 |
2011-12-19 - 2011-12-20 |
開催地(和) |
芝浦工業大学 豊洲キャンパス |
開催地(英) |
|
テーマ(和) |
第13回音声言語シンポジウム |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2011-12-SP-NLC |
本文の言語 |
日本語 |
タイトル(和) |
HMM音声合成のための動的特徴量を用いた音素継続長モデリングの検討 |
サブタイトル(和) |
|
タイトル(英) |
A study on modeling phone duration using dynamic features for HMM-based speech synthesis |
サブタイトル(英) |
|
キーワード(1)(和/英) |
HMM音声合成 / HMM-based speech synthesis |
キーワード(2)(和/英) |
音素継続長 / phone duration |
キーワード(3)(和/英) |
動的特徴量を考慮したパラメ-タ生成 / parameter generation with dynamic features |
キーワード(4)(和/英) |
隠れセミマルコフモデル / hidden semi-Markov model (HSMM) |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
能勢 隆 / Takashi Nose / ノセ タカシ |
第1著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech) |
第2著者 氏名(和/英/ヨミ) |
小林 隆夫 / Takao Kobayashi / コバヤシ タカオ |
第2著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2011-12-20 17:00:00 |
発表時間 |
25分 |
申込先研究会 |
SP |
資料番号 |
NLC2011-55, SP2011-100 |
巻番号(vol) |
vol.111 |
号番号(no) |
no.364(NLC), no.365(SP) |
ページ範囲 |
pp.197-202 |
ページ数 |
6 |
発行日 |
2011-12-12 (NLC, SP) |
|