講演名 | 2008-01-25 Tree Based Clusteringを利用した音節波形接続型音声合成法に関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般) 植村 和久, 村上 仁一, 池原 悟, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 音声合成法の手法の1つとして,音節波形接続型音声合成法が提案されている.この手法の問題点の1つとして,任意の一般名詞を作成する際に大量の録音単語が必要となることが挙げられる.そこで収録されているデータベースに対してTree Based Clusteringを行うことで,理論上は全ての音声を作成出来る.しかし,音声品質が非常に悪い音声もある.本論文では,異なる2つのモデルでTree Based Clusteringを行い,音声品質の改善を目指す.音声品質の評価には,オピニオン評価実験および対比較実験を用いる.オピニオン評価実験の結果,標準モデルの音声が1.7,拡張モデルの音声は2.5という値が得られた.また,対比較実験の結果,標準モデルの音声が20%,拡張モデルの音声が80%となった. |
抄録(英) | Word synthesis by concatenating syllabic components method is proposed as a speech synthesis method. As a problem of this technique, large amount of recording words is needed when we make an arbitrary general noun. Then, all speech ideally can be made by doing tree-based clustering for collected database. However, very low quality speech is generated sometimes. In this paper, our aim is to improvement of the speech quality by doing tree-based clustering with two different models. The mean opinion score (MOS) and the ABX test are used for the evaluation of the speech quality. As a result of the MOS, the standard model was obtained 1.7 and the enhanced model was obtained 2.5. Moreover, as a result of an ABX test, the standard model was obtained 20% and the enhanced model was obtained 80%. |
キーワード(和) | クラスタリング / 木に基づく状態共有 / 音節波形接続型音声合成 / 音節素片 |
キーワード(英) | tree-based clustering / concatenating syllabic components / word synthesis / MFCC |
資料番号 | TL2007-86,SP2007-181,WIT2007-86 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2008/1/18(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | JPN |
タイトル(和) | Tree Based Clusteringを利用した音節波形接続型音声合成法に関する検討(福祉と知能・情動・認知障害,福祉と音声処理,一般) |
サブタイトル(和) | |
タイトル(英) | Study for Word Synthesis by Concatenating Syllabic Components using Tree Based Clustering |
サブタイトル(和) | |
キーワード(1)(和/英) | クラスタリング / tree-based clustering |
キーワード(2)(和/英) | 木に基づく状態共有 / concatenating syllabic components |
キーワード(3)(和/英) | 音節波形接続型音声合成 / word synthesis |
キーワード(4)(和/英) | 音節素片 / MFCC |
第 1 著者 氏名(和/英) | 植村 和久 / Kazuhisa UEMURA |
第 1 著者 所属(和/英) | 鳥取大学工学部知能情報工学科 Faculty of Engineering, Tottori University |
第 2 著者 氏名(和/英) | 村上 仁一 / Jin'ichi MURAKAMI |
第 2 著者 所属(和/英) | 鳥取大学工学部知能情報工学科 Faculty of Engineering, Tottori University |
第 3 著者 氏名(和/英) | 池原 悟 / Satoru IKEHARA |
第 3 著者 所属(和/英) | 鳥取大学工学部知能情報工学科 Faculty of Engineering, Tottori University |
発表年月日 | 2008-01-25 |
資料番号 | TL2007-86,SP2007-181,WIT2007-86 |
巻番号(vol) | vol.107 |
号番号(no) | 435 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |