講演抄録/キーワード |
講演名 |
2012-11-08 16:00
二段階クラスタリングを用いたHMMに基づく韻律生成 ○三井康行・近藤玲史・加藤正徳(NEC) SP2012-80 |
抄録 |
(和) |
HMM音声合成では自然性の高い韻律が生成可能だが,指定と異なったアクセントを表現するピッチパタンが生成される問題があった.そこで,HMMで生成された韻律におけるピッチパタン概形の異常によるアクセント誤りの削減を目的として,二段階木構造クラスタリングを導入した韻律モデル学習方法を提案する.第一段クラスタリングで用いる質問セットは,ピッチパタン概形に関する質問のみで構成する.その結果,ルートノード近傍における木構造は,ピッチパタン概形に関する質問により分岐されるノードのみで構築される.評価実験の結果,提案手法は従来手法と比較して,決定木構造の規模が同等のまま,HMM韻律生成によるアクセント誤りを半減することを確認した. |
(英) |
HMM-based speech synthesis can generate highly natural prosody, but there is a problem that the pitch patterns represent the accent different from the designation might be generated. In this paper, for the purpose of reducing the error of accent caused by abnormality of pitch pattern outlines in prosody generated by HMM, we propose the learning method of prosody models introduced two-stage decision tree clustering. The set of questions to be used in the first stage of clustering is configuring by the only questions about pitch pattern outlines. Then, the tree structure near the root node is constructed with only the nodes that are split by the question about pitch pattern outlines. As a result of evaluation experiments, we confirmed that the proposed method decrease the error of accent in prosody generation by HMM by half with the decision tree has the same sized structure of the conventional method. |
キーワード |
(和) |
音声合成 / HMM / 韻律生成 / 決定木 / コンテクストクラスタリング / / / |
(英) |
Speech Synthesis / HMM / Prosody Generation / Desision Tree / Context Clustering / / / |
文献情報 |
信学技報, vol. 112, no. 281, SP2012-80, pp. 49-54, 2012年11月. |
資料番号 |
SP2012-80 |
発行日 |
2012-11-01 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2012-80 |
研究会情報 |
研究会 |
SP |
開催期間 |
2012-11-08 - 2012-11-09 |
開催地(和) |
東北工業大学 一番町ロビー |
開催地(英) |
Ichibancho Lobby, Tohoku Institute of Technology |
テーマ(和) |
合成,生成,韻律,音声一般 |
テーマ(英) |
Speech Synthesis, Generation, Prosody, etc. |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2012-11-SP |
本文の言語 |
日本語 |
タイトル(和) |
二段階クラスタリングを用いたHMMに基づく韻律生成 |
サブタイトル(和) |
|
タイトル(英) |
Prosody Generation based on HMM using Tow-stage Clustering |
サブタイトル(英) |
|
キーワード(1)(和/英) |
音声合成 / Speech Synthesis |
キーワード(2)(和/英) |
HMM / HMM |
キーワード(3)(和/英) |
韻律生成 / Prosody Generation |
キーワード(4)(和/英) |
決定木 / Desision Tree |
キーワード(5)(和/英) |
コンテクストクラスタリング / Context Clustering |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
三井 康行 / Yasuyuki Mitsui / ミツイ ヤスユキ |
第1著者 所属(和/英) |
日本電気株式会社 (略称: NEC)
NEC Corporation (略称: NEC) |
第2著者 氏名(和/英/ヨミ) |
近藤 玲史 / Reishi Kondo / コンドウ レイシ |
第2著者 所属(和/英) |
日本電気株式会社 (略称: NEC)
NEC Corporation (略称: NEC) |
第3著者 氏名(和/英/ヨミ) |
加藤 正徳 / Masanori Kato / カトウ マサノリ |
第3著者 所属(和/英) |
日本電気株式会社 (略称: NEC)
NEC Corporation (略称: NEC) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2012-11-08 16:00:00 |
発表時間 |
30分 |
申込先研究会 |
SP |
資料番号 |
SP2012-80 |
巻番号(vol) |
vol.112 |
号番号(no) |
no.281 |
ページ範囲 |
pp.49-54 |
ページ数 |
6 |
発行日 |
2012-11-01 (SP) |