講演抄録/キーワード |
講演名 |
2020-03-03 09:00
組み込み向けHMM音声合成における大規模音声コーパスの利用に関する検討 ○西澤信行・小原朋広・石先広海(KDDI総合研究所) EA2019-141 SIP2019-143 SP2019-90 |
抄録 |
(和) |
組み込み機器向けのHMM音声合成技術に基づく音声合成システムで,59.3時間の大規模音声コーパスから学習したサイズの大きいHMMを用いた場合でも実時間処理が可能なことを示す.既に我々は,組み込み機器向けに波形生成処理を高速化し,さらにパラメータ生成処理のブロック処理化により必要なRAMサイズを削減することで,マイクロコントローラ(MCU)上で動作する音声合成システムを開発している.システムにおいてHMMのサイズが処理時間に影響する部分は主に決定木処理だが,モデルサイズに対する処理コストの増加は対数オーダであることから,モデルデータを格納できるだけのサイズのフラッシュメモリを用いる必要がある点を除けば,高品質化のためにサイズの大きいHMMを用いることは容易と考えられる.実験により,我々のシステムが従来の約4倍のサイズのモデルデータを用いて音声を合成した場合でも実時間処理が可能な速度性能を有していることを確認した. |
(英) |
This study shows that our speech synthesis system based on HMM speech synthesis for embedded devices can perform real-time processing even with a large model HMM trained from a large-scale speech corpus of 59.3 hours. We have already proposed a speech synthesis system for a microcontroller (MCU) in which reduction of the computational costs and required RAM size are achieved by a fast waveform generation method and block processing of parameter generation processing, respectively. Since the size of the HMMs logarithmically affects the computational cost and the size is less dependent on processing other than the decision tree processing, a large-sized HMM for high-quality speech sounds can be adopted where a large flash memory is useable. The results of the experiment of this study shows that the processing speed of our system is sufficient for the real-time processing even where the large HMM about four times the size of the conventional one is used. |
キーワード |
(和) |
HMM音声合成 / 大規模音声コーパス / 組み込みシステム / / / / / |
(英) |
HMM-based speech synthesis / large-scale speech corpus / embedded systems / / / / / |
文献情報 |
信学技報, vol. 119, no. 441, SP2019-90, pp. 231-236, 2020年3月. |
資料番号 |
SP2019-90 |
発行日 |
2020-02-24 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2019-141 SIP2019-143 SP2019-90 |
研究会情報 |
研究会 |
SP EA SIP |
開催期間 |
2020-03-02 - 2020-03-03 |
開催地(和) |
沖縄産業支援センター |
開催地(英) |
Okinawa Industry Support Center |
テーマ(和) |
音声,応用/電気音響,信号処理,一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2020-03-SP-EA-SIP |
本文の言語 |
日本語 |
タイトル(和) |
組み込み向けHMM音声合成における大規模音声コーパスの利用に関する検討 |
サブタイトル(和) |
|
タイトル(英) |
A Study for HMM-based embedded speech synthesis using a large-scale speech corpus |
サブタイトル(英) |
|
キーワード(1)(和/英) |
HMM音声合成 / HMM-based speech synthesis |
キーワード(2)(和/英) |
大規模音声コーパス / large-scale speech corpus |
キーワード(3)(和/英) |
組み込みシステム / embedded systems |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
西澤 信行 / Nobuyuki Nishizawa / ニシザワ ノブユキ |
第1著者 所属(和/英) |
株式会社KDDI総合研究所 (略称: KDDI総合研究所)
KDDI Research, Inc. (略称: KDDI Research, Inc.) |
第2著者 氏名(和/英/ヨミ) |
小原 朋広 / Tomohiro Obara / オバラ トモヒロ |
第2著者 所属(和/英) |
株式会社KDDI総合研究所 (略称: KDDI総合研究所)
KDDI Research, Inc. (略称: KDDI Research, Inc.) |
第3著者 氏名(和/英/ヨミ) |
石先 広海 / Hiromi Ishizaki / イシザキ ヒロミ |
第3著者 所属(和/英) |
株式会社KDDI総合研究所 (略称: KDDI総合研究所)
KDDI Research, Inc. (略称: KDDI Research, Inc.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2020-03-03 09:00:00 |
発表時間 |
90分 |
申込先研究会 |
SP |
資料番号 |
EA2019-141, SIP2019-143, SP2019-90 |
巻番号(vol) |
vol.119 |
号番号(no) |
no.439(EA), no.440(SIP), no.441(SP) |
ページ範囲 |
pp.231-236 |
ページ数 |
6 |
発行日 |
2020-02-24 (EA, SIP, SP) |
|