お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2011-12-20 17:00
HMM音声合成のための動的特徴量を用いた音素継続長モデリングの検討
能勢 隆小林隆夫東工大NLC2011-55 SP2011-100
抄録 (和) HMM音声合成における音素継続長の推定精度の改善を目的とし,
動的特徴量を用いた音素継続長のモデル化および生成手法を提案する.
継続長のモデル化については隠れセミマルコフモデル(HSMM)により
状態継続長を明示的にモデル化する手法が提案されているが,
音素継続長が直接モデル化されておらず,また音素間の継続長の
関係はコンテキストのみで表現されている.
提案法では,音素継続長を観測デ-タとみなし直接モデル化を行う.
モデル化の際には,音素間の継続長の相関を明示的に考慮するために
静的特徴量だけでなく音素継続長の動的特徴量も用いて学習を行う.
合成時には静的および動的特徴量を用いて音素継続長系列を生成することにより
音素間の継続長の相関を合成音声に反映させることが可能となる.
静的特徴量のみを用いた場合や対数継続長を用いた場合などとの
比較を行い,提案法の有効性を示す. 
(英) This paper proposes a technique for modeling and generating phone durations
using their dynamic features to improve prediction accuracy of phone durations in HMM-based speech synthesis.
For the duration modeling, a technique with explicit state-duration modeling
based on hidden semi-Markov model (HSMM) has been proposed.
However, the HSMM cannot directly model phone durations,
and the relation of phone durations among adjacent phonemes are represented only by context labels.
In the proposed technique, phone durations are regarded as observable data
obtained by manual labeling or forced alignment
and are directly modeled using single Gaussian distributions.
To explicitly take into account the correlation of phone durtions in the model training and speech synthesis,
we use not only static phone durations but also dynamic ones.
When synthesizing speech, we generate a phone-duration sequence from the trained duration models
using a parameter generation algorithm with static and dynamic features.
We evaluate the performance of our duration modeling technique
by comparing to other techniques with static or static log-duration features.
キーワード (和) HMM音声合成 / 音素継続長 / 動的特徴量を考慮したパラメ-タ生成 / 隠れセミマルコフモデル / / / /  
(英) HMM-based speech synthesis / phone duration / parameter generation with dynamic features / hidden semi-Markov model (HSMM) / / / /  
文献情報 信学技報, vol. 111, no. 365, SP2011-100, pp. 197-202, 2011年12月.
資料番号 SP2011-100 
発行日 2011-12-12 (NLC, SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード NLC2011-55 SP2011-100

研究会情報
研究会 SP NLC IPSJ-SLP  
開催期間 2011-12-19 - 2011-12-20 
開催地(和) 芝浦工業大学 豊洲キャンパス 
開催地(英)  
テーマ(和) 第13回音声言語シンポジウム 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2011-12-SP-NLC 
本文の言語 日本語 
タイトル(和) HMM音声合成のための動的特徴量を用いた音素継続長モデリングの検討 
サブタイトル(和)  
タイトル(英) A study on modeling phone duration using dynamic features for HMM-based speech synthesis 
サブタイトル(英)  
キーワード(1)(和/英) HMM音声合成 / HMM-based speech synthesis  
キーワード(2)(和/英) 音素継続長 / phone duration  
キーワード(3)(和/英) 動的特徴量を考慮したパラメ-タ生成 / parameter generation with dynamic features  
キーワード(4)(和/英) 隠れセミマルコフモデル / hidden semi-Markov model (HSMM)  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 能勢 隆 / Takashi Nose / ノセ タカシ
第1著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech)
第2著者 氏名(和/英/ヨミ) 小林 隆夫 / Takao Kobayashi / コバヤシ タカオ
第2著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2011-12-20 17:00:00 
発表時間 25分 
申込先研究会 SP 
資料番号 NLC2011-55, SP2011-100 
巻番号(vol) vol.111 
号番号(no) no.364(NLC), no.365(SP) 
ページ範囲 pp.197-202 
ページ数
発行日 2011-12-12 (NLC, SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会