講演名 2014-01-24
音声モーフィングによる聴感的印象制御に有効な特徴量の検証(オーガナイズドセッション「多様な音声の認識・合成へ向けて」,音声,言語,対話,一般)
森勢 将雅, 都築 聡, 坂野 秀樹, 小澤 賢司,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,音声についての言語的な明瞭性ではなく,聴感的印象(本研究では聴いた印象が「はきはき」「もごもご」していることを対象とする)の制御に向けた取り組みについて述べる.本研究の目的は,所謂音声明瞭度・了解度のような言語情報の書き取りで生じる差ではなく,会話が可能な程度に明瞭であるものの,聴取者に与える印象が異なる場合を対象とした差の評価・制御にある.これまでの検討により,発話中の口の動きが聴感的印象に関連することが確認されたので,本稿では,聴感的印象を改善するための声質変換を実現するための検討を行う.ここでは,口の動きに対応する制御パラメタを明らかにするため,音声モーフィングによりいくつかのパラメタを段階的に変化させ,主観評価により聴感的印象の評価を行うこととした.はきはき語す声ともごもご話す声を対象に,声道断面積関数(Vocal tract area function:VTAF),残差スペクトル,F0,非周期性指標それぞれについて独立してモーフィングを行うことで聴感的印象に対応する特徴量を調査する.実験の結果,残差スペクトルとVATFが聴感的印象に強く影響することが確認され,F0と非周期性指標には影響されないことが明らかとなった.本結果は,聴感的印象はスペクトル包絡の特徴のみで制御可能であることを示唆するものである.
抄録(英) In this article, a method for controlling the auditory impression (defined as only muffled and brisk speech) is introduced. Auditory impression defined in this article differs from speech articulation because the human perceives the different impression regardless of the phoneme and syllable information when they listen to two different types of speech. A criterion based on the vocal tract area function (VATF) has been proposed to identify the auditory impression. To improve the auditory impression by voice conversion, this research focuses on the several parameters including VTAF. Muffled and brisk speech uttered by ten speakers was morphed with several parameters, and a subjective evaluation was carried out to demonstrate the effective parameter associated with the auditory impression. F0, aperiodicity, VATF and residual spectrum were used for the experiment. The result indicated that the VATF and residual spectrum affects the auditory impression, and it suggested that the auditory impression was controlled by only the spectral envelope.
キーワード(和) 音声分析合成 / 声質変換 / 声道断面積関数 / モーフィング
キーワード(英) Speech analysis/synthesis / voice conversion / vocal tract area function / voice morphing
資料番号 SP2013-105
発行日

研究会情報
研究会 SP
開催期間 2014/1/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 音声モーフィングによる聴感的印象制御に有効な特徴量の検証(オーガナイズドセッション「多様な音声の認識・合成へ向けて」,音声,言語,対話,一般)
サブタイトル(和)
タイトル(英) A study of effective features for controlling the auditory impression based on voice morphing
サブタイトル(和)
キーワード(1)(和/英) 音声分析合成 / Speech analysis/synthesis
キーワード(2)(和/英) 声質変換 / voice conversion
キーワード(3)(和/英) 声道断面積関数 / vocal tract area function
キーワード(4)(和/英) モーフィング / voice morphing
第 1 著者 氏名(和/英) 森勢 将雅 / Masanori MORISE
第 1 著者 所属(和/英) 山梨大学大学院医学工学総合研究部
Interdisciplinary Graduate School of Medicine and Engineering, University of Yamanashi
第 2 著者 氏名(和/英) 都築 聡 / Satoshi TSUZUKI
第 2 著者 所属(和/英) 山梨大学大学院医学工学総合研究部
Interdisciplinary Graduate School of Medicine and Engineering, University of Yamanashi
第 3 著者 氏名(和/英) 坂野 秀樹 / Hideki BANNO
第 3 著者 所属(和/英) 名城大学理工学部
Faculty of Science and Technology, Meijo University
第 4 著者 氏名(和/英) 小澤 賢司 / Kenji OZAWA
第 4 著者 所属(和/英) 山梨大学大学院医学工学総合研究部
Interdisciplinary Graduate School of Medicine and Engineering, University of Yamanashi
発表年月日 2014-01-24
資料番号 SP2013-105
巻番号(vol) vol.113
号番号(no) 404
ページ範囲 pp.-
ページ数 6
発行日