講演名 2007/10/18
構造的表象からの音声生成に関する基礎的検討(合成,生成,韻律,一般)
齋藤 大輔, 朝川 智, 峯松 信明, 広瀬 啓吉,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声は年齢,性別,声道長や音響機器などの非言語的特徴によって不可避に歪む.筆者らはこれまでにこれらの非言語性歪みに不変な音声の構造的・抽象的表象を提案してきた.本研究では音声の構造的表象に基づく音声合成の枠組みについて提案する.提案する枠組みでは発話全体の語形(語ゲシュタルトともよばれる)を考え,それに対して身体特性,収録機器の伝送特性を与える事で初めて,聞き手が聴取する音響信号が生成される.この枠組みは,幼児の音声模倣のモデルとして解釈可能である.本報では提案する枠組みの基礎的検討として,構造的表象からの音声生成問題を制約条件下でのケプストラム空間の探索問題として定式化し,音声合成実験を行った.結果として一定の音韻性を保ち,構造抽出時の話者性ではなく,合成対象の話者性を持った音声を得ることができた.
抄録(英) Speech acoustics vary due to differences in age, gender, vocal tract length, microphone, and so on. The authors recently have proposed a structural and abstract representation of speech, where these variations were effectively removed. In this study, a framework of speech synthesis based on this structural representation of speech is proposed. In the proposed framework, a system needs a "speech gestalt" of one utterance, properties of vocal tract length of speaker and properties of transmission of microphone. Using these information, acoustic signals to which hearers listen are generated. This framework can be regarded as a model of vocal imitation of infants. For a fundamental consideration of this framework, the authors considered this framework as a problem of searching cepstrum space for the solutions under some constraints in this report. As results of experiments, speech samples which have proper phonological characteristics were synthesized.
キーワード(和) 構造的表象 / 話者不変 / 音声模倣 / 言語獲得 / 解探索
キーワード(英) structural representation / speaker invariant / vocal imitation / language acquisition / searching for solutions
資料番号 SP2007-80
発行日

研究会情報
研究会 SP
開催期間 2007/10/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 構造的表象からの音声生成に関する基礎的検討(合成,生成,韻律,一般)
サブタイトル(和)
タイトル(英) A fundamental study of structure-to-speech conversion
サブタイトル(和)
キーワード(1)(和/英) 構造的表象 / structural representation
キーワード(2)(和/英) 話者不変 / speaker invariant
キーワード(3)(和/英) 音声模倣 / vocal imitation
キーワード(4)(和/英) 言語獲得 / language acquisition
キーワード(5)(和/英) 解探索 / searching for solutions
第 1 著者 氏名(和/英) 齋藤 大輔 / Daisuke SAITO
第 1 著者 所属(和/英) 東京大学大学院新領域創成科学研究科
Graduate School of Frontier Sciences, The University of Tokyo
第 2 著者 氏名(和/英) 朝川 智 / Satoshi ASAKAWA
第 2 著者 所属(和/英) 東京大学大学院新領域創成科学研究科
Graduate School of Frontier Sciences, The University of Tokyo
第 3 著者 氏名(和/英) 峯松 信明 / Nobuaki MINEMATSU
第 3 著者 所属(和/英) 東京大学大学院新領域創成科学研究科
Graduate School of Frontier Sciences, The University of Tokyo
第 4 著者 氏名(和/英) 広瀬 啓吉 / Keikichi HIROSE
第 4 著者 所属(和/英) 東京大学大学院情報理工学系研究科
Graduate School of Information Science and Technology, The University of Tokyo
発表年月日 2007/10/18
資料番号 SP2007-80
巻番号(vol) vol.107
号番号(no) 282
ページ範囲 pp.-
ページ数 6
発行日