お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2012-11-08 16:00
二段階クラスタリングを用いたHMMに基づく韻律生成
三井康行近藤玲史加藤正徳NECSP2012-80
抄録 (和) HMM音声合成では自然性の高い韻律が生成可能だが,指定と異なったアクセントを表現するピッチパタンが生成される問題があった.そこで,HMMで生成された韻律におけるピッチパタン概形の異常によるアクセント誤りの削減を目的として,二段階木構造クラスタリングを導入した韻律モデル学習方法を提案する.第一段クラスタリングで用いる質問セットは,ピッチパタン概形に関する質問のみで構成する.その結果,ルートノード近傍における木構造は,ピッチパタン概形に関する質問により分岐されるノードのみで構築される.評価実験の結果,提案手法は従来手法と比較して,決定木構造の規模が同等のまま,HMM韻律生成によるアクセント誤りを半減することを確認した. 
(英) HMM-based speech synthesis can generate highly natural prosody, but there is a problem that the pitch patterns represent the accent different from the designation might be generated. In this paper, for the purpose of reducing the error of accent caused by abnormality of pitch pattern outlines in prosody generated by HMM, we propose the learning method of prosody models introduced two-stage decision tree clustering. The set of questions to be used in the first stage of clustering is configuring by the only questions about pitch pattern outlines. Then, the tree structure near the root node is constructed with only the nodes that are split by the question about pitch pattern outlines. As a result of evaluation experiments, we confirmed that the proposed method decrease the error of accent in prosody generation by HMM by half with the decision tree has the same sized structure of the conventional method.
キーワード (和) 音声合成 / HMM / 韻律生成 / 決定木 / コンテクストクラスタリング / / /  
(英) Speech Synthesis / HMM / Prosody Generation / Desision Tree / Context Clustering / / /  
文献情報 信学技報, vol. 112, no. 281, SP2012-80, pp. 49-54, 2012年11月.
資料番号 SP2012-80 
発行日 2012-11-01 (SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2012-80

研究会情報
研究会 SP  
開催期間 2012-11-08 - 2012-11-09 
開催地(和) 東北工業大学 一番町ロビー 
開催地(英) Ichibancho Lobby, Tohoku Institute of Technology 
テーマ(和) 合成,生成,韻律,音声一般 
テーマ(英) Speech Synthesis, Generation, Prosody, etc. 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2012-11-SP 
本文の言語 日本語 
タイトル(和) 二段階クラスタリングを用いたHMMに基づく韻律生成 
サブタイトル(和)  
タイトル(英) Prosody Generation based on HMM using Tow-stage Clustering 
サブタイトル(英)  
キーワード(1)(和/英) 音声合成 / Speech Synthesis  
キーワード(2)(和/英) HMM / HMM  
キーワード(3)(和/英) 韻律生成 / Prosody Generation  
キーワード(4)(和/英) 決定木 / Desision Tree  
キーワード(5)(和/英) コンテクストクラスタリング / Context Clustering  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 三井 康行 / Yasuyuki Mitsui / ミツイ ヤスユキ
第1著者 所属(和/英) 日本電気株式会社 (略称: NEC)
NEC Corporation (略称: NEC)
第2著者 氏名(和/英/ヨミ) 近藤 玲史 / Reishi Kondo / コンドウ レイシ
第2著者 所属(和/英) 日本電気株式会社 (略称: NEC)
NEC Corporation (略称: NEC)
第3著者 氏名(和/英/ヨミ) 加藤 正徳 / Masanori Kato / カトウ マサノリ
第3著者 所属(和/英) 日本電気株式会社 (略称: NEC)
NEC Corporation (略称: NEC)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2012-11-08 16:00:00 
発表時間 30分 
申込先研究会 SP 
資料番号 SP2012-80 
巻番号(vol) vol.112 
号番号(no) no.281 
ページ範囲 pp.49-54 
ページ数
発行日 2012-11-01 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会