お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2016-01-14 13:00
[招待講演]EMAデータを利用した統計的音声合成における調音制御
山岸順一NII/エジンバラ大SP2015-88
抄録 (和) 本論文では、Electro-Magnetic Articulograph (EMA) 等により取得された、舌・唇等の調音器官の発話中の位置情報 “調音運動” と、対応する音声波形信号や言語情報とを同時に利用した統計的音声合成システムについて紹介する。統計的音声合成方式は、非常に明瞭性の高い音声を生成可能であること、モデルパラメータを変化させることで多様な音声を合成可能であることが利点として知られているが、その一方で、音声波形信号のみから音響モデルの学習を行っていることから、音声生成メカニズム、特に調音位置や調音運動に関する情報・知見を十分に活用することは容易ではなかった。そこで我々は、EMA データといった調音器官の計測データを音響モデルの一部として利用し、調音特徴量を操作することで、スペクトルなどの音響特徴量を操作した場合よりも直感的な制御が可能になることを示してきた。本稿ではこれらの概要及び一部の実験結果を示す。 
(英) This paper describes speech processing work in which articulator movements are used in conjunction with the acoustic speech signal and/or linguistic information. By “articulator movements”, we mean the changing positions of human speech articulators such as the tongue and lips, which may be recorded by EMA, amongst other articulography techniques. In this paper we provide an overview of statistical voice conversion and speech synthesis techniques which use articulator movements as part of the process to generate synthetic speech. The statistical parametirc speech synthesis is able to synthesise highly intelligible and smooth speech sounds. In addition, the HMM’s parameters can be adapted using a small amount of training data to diversify the characteristics of syn- thetic speech. However, this approach still has some limitations.The structure of conventional HMM-based acoustic models is akin to a black box, without explicit correspondence to the speech production mechanism. It is difficult to integrate phonetic knowledge concerning the properties of speech into acoustic feature prediction directly. By incorporating articulatory signals we can explicitly introduce articulator movements into the speech synthesis framework to make speech synthesis outputs “articulatorily controllable”, meaning that we can manipulate synthetic speech not only in the acoustic domain but also in the articulatory domain intuitively. In this paper we have introduced an overview of several systems that we have built and experiments that we have conducted for this purpose.
キーワード (和) HMM 音声合成 / 調音運動 / EMA / 調音運動 / / / /  
(英) HMM speech synthesis / Articulatory movement / EMA / Multiple regression HMM / / / /  
文献情報 信学技報, vol. 115, no. 392, SP2015-88, pp. 19-24, 2016年1月.
資料番号 SP2015-88 
発行日 2016-01-07 (SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2015-88

研究会情報
研究会 SP  
開催期間 2016-01-14 - 2016-01-14 
開催地(和) サンピアンかわさき 
開催地(英) Sunpian Kawasaki 
テーマ(和) 合成、生成、韻律、音声一般 
テーマ(英) Synthesis, Generation, Prosody, etc. 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2016-01-SP 
本文の言語 日本語 
タイトル(和) EMAデータを利用した統計的音声合成における調音制御 
サブタイトル(和)  
タイトル(英) Articulatory controllable statistical parametric speech synthesis using EMA data 
サブタイトル(英)  
キーワード(1)(和/英) HMM 音声合成 / HMM speech synthesis  
キーワード(2)(和/英) 調音運動 / Articulatory movement  
キーワード(3)(和/英) EMA / EMA  
キーワード(4)(和/英) 調音運動 / Multiple regression HMM  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 山岸 順一 / Junichi Yamagishi /
第1著者 所属(和/英) 国立情報学研究所/エジンバラ大 (略称: NII/エジンバラ大)
National Institute of Informatics/University of Edinburgh (略称: NII/Univ. Edinburgh)
第2著者 氏名(和/英/ヨミ) / /
第2著者 所属(和/英) (略称: )
(略称: )
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2016-01-14 13:00:00 
発表時間 60分 
申込先研究会 SP 
資料番号 SP2015-88 
巻番号(vol) vol.115 
号番号(no) no.392 
ページ範囲 pp.19-24 
ページ数
発行日 2016-01-07 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会