お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2016-12-20 15:10
[ポスター講演]基本周波数パターンと音韻特徴量系列の同時生成モデルによる韻律指令列推定
佐藤遼太郎東大)・亀岡弘和柏野邦夫NTTSP2016-56
抄録 (和) 基本周波数($F_0$)パターンの物理的な生成過程を記述した藤崎モデルのパラメータであるフレーズ・アクセント指令は音声の韻律的特徴と対応しており,実測の$F_0$パターンからこれらを高速かつ高精度に推定することができれば非言語情報の解析・合成を行う上で有用である。以前我々は,藤崎モデルをベースとし,フレーズ・アクセント指令列の生成プロセスを隠れマルコフモデル(HMM)により表現した$F_0$パターンの確率モデルを提案している。このモデルのポイントは,フレーズ・アクセント指令列の推定をExpectation-Maximization (EM)アルゴリズムを用いたHMMの状態系列推定問題にエレガントに帰着させた点にあるが,推定精度と計算効率の両面で改善の余地が残されていた。藤崎モデルのアクセント指令は音節またはモーラの境界で生起する傾向にあるため,音節やモーラの境界では通常スペクトル特徴量の急激な変化を伴うことから,スペクトル特徴量の変化量を手がかりにすることでアクセント指令の開始時刻と終了時刻の推定を高精度化できる可能性がある。そこで本稿では,スペクトル特徴量系列とフレーズ・アクセント指令列を同時生成するHMMを考えることで,スペクトル特徴量を補助情報として用いながらフレーズ・アクセント指令列推定を行うことができるアルゴリズムを提案する.また,当該アルゴリズムにおいて,状態事後確率計算を最適状態系列推定に置き換えることでフレーズ・アクセント指令列の推定精度を悪化させることなくアルゴリズムを効率化できることを示す.実験の結果,提案法は従来法に比べ推定速度は約16倍,精度は3%程度改善することが確かめられた. 
(英) On the basis of the Fujisaki model, we propose a fast algorithm for estimating the model parameters, namely, the timings and magnitudes of the phrase and accent commands. We propose a hard expectation-maximization (EM) algorithm for parameter inference where the E step of the conventional method is replaced with a point estimation procedure to accelerate the estimation process. We also add a generative process of a spectral feature sequence to the generative model to improve the parameter estimation accuracy by using phonological information as an additional clue. The experiments confirmed that the present algorithm was 16 times faster and estimated parameters about 3% more acculately than the conventional algorithm.
キーワード (和) 音声基本周波数軌跡推定 / 藤崎モデル / 韻律情報処理 / EMアルゴリズム / / / /  
(英) voice fundamental frequency contour estimation / Fujisaki model / prosodic information processing / EM algorithm / / / /  
文献情報 信学技報, vol. 116, no. 378, SP2016-56, pp. 43-48, 2016年12月.
資料番号 SP2016-56 
発行日 2016-12-13 (SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
査読に
ついて
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります.
PDFダウンロード SP2016-56

研究会情報
研究会 SP IPSJ-SLP NLC IPSJ-NL  
開催期間 2016-12-20 - 2016-12-22 
開催地(和) NTT武蔵野研究開発センタ 
開催地(英) NTT Musashino R&D 
テーマ(和) 第18回音声言語シンポジウム & 第3回自然言語処理シンポジウム 
テーマ(英) The 18th Spoken Language Symposium & The Third Natural Language Processing Symposium 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2016-12-SP-SLP-NLC-NL 
本文の言語 日本語 
タイトル(和) 基本周波数パターンと音韻特徴量系列の同時生成モデルによる韻律指令列推定 
サブタイトル(和)  
タイトル(英) Fast algorithm for statistical phrase/accent command estimation based on generative model incorporating spectral features 
サブタイトル(英)  
キーワード(1)(和/英) 音声基本周波数軌跡推定 / voice fundamental frequency contour estimation  
キーワード(2)(和/英) 藤崎モデル / Fujisaki model  
キーワード(3)(和/英) 韻律情報処理 / prosodic information processing  
キーワード(4)(和/英) EMアルゴリズム / EM algorithm  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 佐藤 遼太郎 / Ryotaro Sato / サトウ リョウタロウ
第1著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: The Univ. of Tokyo)
第2著者 氏名(和/英/ヨミ) 亀岡 弘和 / Hirokazu Kameoka / カメオカ ヒロカズ
第2著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第3著者 氏名(和/英/ヨミ) 柏野 邦夫 / Kunio Kashino / カシノ クニオ
第3著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2016-12-20 15:10:00 
発表時間 90分 
申込先研究会 SP 
資料番号 SP2016-56 
巻番号(vol) vol.116 
号番号(no) no.378 
ページ範囲 pp.43-48 
ページ数
発行日 2016-12-13 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会