講演名 2013-12-20
言語モデルと音響モデルを利用したアクセント句境界の自動推定(音声対話・合成,第15回音声言語シンポジウム)
鈴木啓史, 郡山 智樹, 能勢 隆, 篠崎 隆宏, 小林 隆夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) テキスト音声合成システムの構築にはアクセント情報に関する韻律情報ラベルが付与された音声データが必要不可欠であるが,アクセント情報の付与は主に人手で行われており高コストである,そこで本研究では,音声データの自動ラベリングを目的としたアクセント句の境界推定手法を提案する.提案手法では,音声を書き起こしたテキスト情報だけでなく,音声から得られるFOなどの音響特徴量を使用する.アクセント句境界モデルおよびアクセント型モデルといった言語モデルには条件付き確率場(CRF)を,そして音響モデルに隠れマルコフモデル(HMM)を使用し,それらを組み合わせてアクセント句の境界を推定する.本稿では,読み上げ音声に対するアクセント句境界推定実験を行い,従来法に比べ推定精度が向上することを示した.
抄録(英) This paper proposes a technique for automatically estimating accent phrase boundaries for text-to-speech synthesis systems. To construct speech synthesis systems, we need to prepare a database that has annotations of prosodic information including accents. However, manual annotation for this purpose generally requires costly process. In contrast, the proposed method utilizes conditional random field (CRF) for the language models of accent phrase boundary and accent type, and uses hidden markov model (HMM) for the acoustic feature model. In this paper, we confirmed that the proposed method improved the estimation accuracy for reading-style speech data compared with conventional method.
キーワード(和) アクセント句境界 / 韻律 / HMM / CRF
キーワード(英) accent phrase boundary / prodosy / HMM / CRF
資料番号 SP2013-89
発行日

研究会情報
研究会 SP
開催期間 2013/12/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 言語モデルと音響モデルを利用したアクセント句境界の自動推定(音声対話・合成,第15回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Automatic Estimation of Accent Phrase Boundaries Using Language and Acoustic Models
サブタイトル(和)
キーワード(1)(和/英) アクセント句境界 / accent phrase boundary
キーワード(2)(和/英) 韻律 / prodosy
キーワード(3)(和/英) HMM / HMM
キーワード(4)(和/英) CRF / CRF
第 1 著者 氏名(和/英) 鈴木啓史 / Hiroshi SUZUKI
第 1 著者 所属(和/英) 東京工業大学大学院総合理工学研究科
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 郡山 智樹 / Tomoki KORIYAMA
第 2 著者 所属(和/英) 東京工業大学大学院総合理工学研究科
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 能勢 隆 / Takashi NOSE
第 3 著者 所属(和/英) 東北大学大学院工学研究科
School of Engineering, Tohoku University
第 4 著者 氏名(和/英) 篠崎 隆宏 / Takahiro SHINOZAKI
第 4 著者 所属(和/英) 東京工業大学大学院総合理工学研究科
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
第 5 著者 氏名(和/英) 小林 隆夫 / Takao KOBAYASHI
第 5 著者 所属(和/英) 東京工業大学大学院総合理工学研究科
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
発表年月日 2013-12-20
資料番号 SP2013-89
巻番号(vol) vol.113
号番号(no) 366
ページ範囲 pp.-
ページ数 6
発行日