講演名 2016-03-29
[ポスター講演]絵本読み聞かせ風音声合成のためのコンテキストラベル設計に関する実験的検討
百武 恭汰(東大), 齋藤 大輔(東大), 峯松 信明(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 絵本を読み聞かせるような音声の合成を目指し,読み聞かせ音声において特徴的に見られる読み方の工夫を反映したコンテキストラベルの設計を行った.女性保育士による絵本の読み聞かせ音声を収録したコーパスに対する韻律ラベリングを行い,読み聞かせ音声に特徴的な現象として,アクセント句末の上昇調BPM(Boundary Pitch Movement),長音化,抑揚の程度や発話速度の変化を確認した.これらの現象,および当該音声が地の文であるかセリフであるか,更に後者の場合どのようなキャラクターのセリフであるかに関するコンテキストを考慮して,読み聞かせ用コンテキストラベルと定義した.読み聞かせ用コンテキストラベルを付与した音声コーパスを用いてHMM音声合成器を構築した.コンテキストクラスタリングの様子,および,聴取実験の結果から,設計したコンテキストの効果が確認された.
抄録(英) Context labels for infant-directed storytelling speech synthesis are investigated. After collecting one-hour storytelling speech samples, special context labels for infant-directed storytelling are designedthrough careful listening to the samples. Here, rising BPM (Boundary Pitch Movement), prolonged mora, range of intonation, and rate of reading are introduced as additional labels. Further, we differentiate descriptive passages from speech passages. Validity of the proposed context labels is examined experimentallyby building HMM speech synthesizers with the proposed labels. Results show that the top-down clustering trees depend on the new labels and the new labels can realize storytelling characteristics in the synthesized speech to some degree.
キーワード(和) HMM音声合成 / 読み聞かせ / IDS / コンテキスト拡張ラベル / 聴取実験
キーワード(英) HMM-based speech synthesis / storytelling / IDS / extended context label / listening experiment
資料番号 EA2015-112,SIP2015-161,SP2015-140
発行日 2016-03-21 (EA, SIP, SP)

研究会情報
研究会 EA / SP / SIP
開催期間 2016/3/28(から2日開催)
開催地(和) 別府国際コンベンションセンター B-ConPlaza
開催地(英) Beppu International Convention Center B-ConPlaza
テーマ(和) 応用/電気音響,音声,信号処理,一般
テーマ(英) Engineering/Electro Acoustics, Speech, Signal Processing, and Related Topics
委員長氏名(和) 羽田 陽一(電通大) / 間野 一則(芝浦工大) / 宝珠山 治(NEC)
委員長氏名(英) Yoichi Haneda(Univ. of Electro-Comm.) / Kazunori Mano(Shibaura Inst. of Tech.) / Osamu Houshuyama(NEC)
副委員長氏名(和) 岩谷 幸雄(東北学院大) / 水町 光徳(九工大) / 北岡 教英(徳島大) / 中静 真(千葉工大) / 奥田 正浩(北九州市大)
副委員長氏名(英) Yukio Iwaya(Tohoku Gakuin Univ.) / Mitsunori Mizumachi(Kyushu Inst. of Tech.) / Norihide Kitaoka(Tokushima Univ.) / Makoto Nakashizuka(Chiba Inst. of Tech.) / Masahiro Okuda(Univ. of Kitakyushu)
幹事氏名(和) 島内 末廣(NTT) / 堀内 俊治(KDDI研) / 岩野 公司(東京都市大) / 滝口 哲也(神戸大) / 辻川 剛範(NEC) / 平林 晃(立命館大)
幹事氏名(英) Suehiro Shimauchi(NTT) / Toshiharu Horiuchi(KDDI R&D Labs.) / Koji Iwano(Tokyo City Univ.) / Tetsuya Takiguchi(Kobe Univ.) / Masanori Tsujikawa(NEC) / Akira Hirabayashi(Ritsumeikan Univ.)
幹事補佐氏名(和) 小山 翔一(東大) / 能勢 隆(東北大) / 浅見 太一(NTT) / 宮田 高道(千葉工大)
幹事補佐氏名(英) Shoichi Koyama(Univ. of Tokyo) / Takashi Nose(Tohoku Univ.) / Taichi Asami(NTT) / Takamichi Miyata(Chiba Inst. of Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Technical Committee on Speech / Technical Committee on Signal Processing
本文の言語 JPN
タイトル(和) [ポスター講演]絵本読み聞かせ風音声合成のためのコンテキストラベル設計に関する実験的検討
サブタイトル(和)
タイトル(英) [Poster Presentation] An experimental study of designing context labels for infant-directed storytelling speech synthesis
サブタイトル(和)
キーワード(1)(和/英) HMM音声合成 / HMM-based speech synthesis
キーワード(2)(和/英) 読み聞かせ / storytelling
キーワード(3)(和/英) IDS / IDS
キーワード(4)(和/英) コンテキスト拡張ラベル / extended context label
キーワード(5)(和/英) 聴取実験 / listening experiment
第 1 著者 氏名(和/英) 百武 恭汰 / Kyota Hyakutake
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 2 著者 氏名(和/英) 齋藤 大輔 / Daisuke Saito
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 3 著者 氏名(和/英) 峯松 信明 / Nobuaki Minematsu
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
発表年月日 2016-03-29
資料番号 EA2015-112,SIP2015-161,SP2015-140
巻番号(vol) vol.115
号番号(no) EA-521,SIP-522,SP-523
ページ範囲 pp.255-260(EA), pp.255-260(SIP), pp.255-260(SP),
ページ数 6
発行日 2016-03-21 (EA, SIP, SP)