講演名 2021-06-19
聴取によって心が和む音声の合成に向けた基礎検討
渡邊 悠希(東北大), 坂本 修一(東北大), 星 貴之(ピクシーダストテクノロジーズ), 長谷 芳樹(ピクシーダストテクノロジーズ), 中野 学(ピクシーダストテクノロジーズ),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 聴取により心が和む音声の合成を最終的な目的として,様々な感情を想定して発話された音声から認識・想起した感情を評価するとともに,その音声のもつ音響特徴量を分析した.感情評価実験の結果,癒やしの感情は感情次元のvalenceが正,activationが負の象限に付置されること,癒やしの程度において認識した感情と想起した感情との間に正の相関があることが明らかとなった.加えて,癒やしの感情とある程度の相関を有する音響特徴量は明らかとなった一方で,通常の音声合成等に用いられる低次の音響特徴量との強い相関は見られなかった.このことは,癒やしの感情を想起させる音声を安定して合成するためには,より適切な音響特徴量を探索する必要があることを示唆している.
抄録(英) The goal of this study is to synthesize speech sound which induces relaxed emotion. As the preliminary study, we investigated how listeners felt when they heard speech sounds with various emotions. In addition, we analyzed the relationship between perceived emotions and the acoustic features of the speech sound with emotions. The results of the experiment revealed that relaxed emotion was categorized in the quadrant of positive valance and negative activation. Moreover, a positive correlation was observed between the recognized and evoked relaxed emotions. On the other hand, the strong correlation between low-order acoustic features commonly used to synthesize emotional speech sound and the amount of perceived relaxed emotion was not seen. These results suggest that more appropriate acoustic features need to be considered for the stable synthesis of the speech sound that induces relaxed emotions in the future work.
キーワード(和) 感情音声 / 音響特徴量 / 癒やし / 感情想起 / 声質変換 / 音声合成
キーワード(英) emotional voice / acoustic features / relaxing / evoked emotion / voice conversion / speech synthesis
資料番号 SP2021-19
発行日 2021-06-11 (SP)

研究会情報
研究会 SP / IPSJ-SLP / IPSJ-MUS
開催期間 2021/6/18(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 音学シンポジウム2021
テーマ(英) OTOGAKU Symposium 2021
委員長氏名(和) 河井 恒(NICT) / 北岡 教英(豊橋技科大) / 竹川 佳成(はこだて未来大)
委員長氏名(英) Hisashi Kawai(NICT) / 北岡 教英(豊橋技科大) / 竹川 佳成(はこだて未来大)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和) 高道 慎之介(東大) / 小川 哲司(早大) / 秋田 祐哉(京大) / 太刀岡 勇気(デンソー) / 高島 遼一(神戸大) / 高道 慎之介(東大) / 森勢 将雅(明治大) / 松原 正樹(筑波大) / 糸山 克寿(東工大) / 深山 覚(産総研) / 大石 康智(NTT) / 平田 圭二(はこだて未来大)
幹事氏名(英) Shinnosuke Takamichi(Univ. of Tokyo) / Tetsuji Ogawa(Waseda Univ.) / 秋田 祐哉(京大) / 太刀岡 勇気(デンソー) / 高島 遼一(神戸大) / 高道 慎之介(東大) / 森勢 将雅(明治大) / 松原 正樹(筑波大) / 糸山 克寿(東工大) / 深山 覚(産総研) / 大石 康智(NTT) / 平田 圭二(はこだて未来大)
幹事補佐氏名(和) 井島 勇祐(NTT)
幹事補佐氏名(英) Yusuke Ijima(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Special Interest Group on Spoken Language Processing / Special Interest Group on Music and Computer
本文の言語 JPN
タイトル(和) 聴取によって心が和む音声の合成に向けた基礎検討
サブタイトル(和) 認識・想起した感情および音響特徴量の観点から
タイトル(英) Preliminary study on synthesizing relaxing voices
サブタイトル(和) from a perspective of recognized/evoked emotions and acoustic features
キーワード(1)(和/英) 感情音声 / emotional voice
キーワード(2)(和/英) 音響特徴量 / acoustic features
キーワード(3)(和/英) 癒やし / relaxing
キーワード(4)(和/英) 感情想起 / evoked emotion
キーワード(5)(和/英) 声質変換 / voice conversion
キーワード(6)(和/英) 音声合成 / speech synthesis
第 1 著者 氏名(和/英) 渡邊 悠希 / Yuki Watanabe
第 1 著者 所属(和/英) 東北大学(略称:東北大)
Tohoku University(略称:Tohoku Univ.)
第 2 著者 氏名(和/英) 坂本 修一 / Shuichi Sakamoto
第 2 著者 所属(和/英) 東北大学(略称:東北大)
Tohoku University(略称:Tohoku Univ.)
第 3 著者 氏名(和/英) 星 貴之 / Takayuki Hoshi
第 3 著者 所属(和/英) ピクシーダストテクノロジーズ株式会社(略称:ピクシーダストテクノロジーズ)
Pixie Dust Technologies, Inc.(略称:Pixie Dust Technologies)
第 4 著者 氏名(和/英) 長谷 芳樹 / Yoshiki Nagatani
第 4 著者 所属(和/英) ピクシーダストテクノロジーズ株式会社(略称:ピクシーダストテクノロジーズ)
Pixie Dust Technologies, Inc.(略称:Pixie Dust Technologies)
第 5 著者 氏名(和/英) 中野 学 / Manabu Nakano
第 5 著者 所属(和/英) ピクシーダストテクノロジーズ株式会社(略称:ピクシーダストテクノロジーズ)
Pixie Dust Technologies, Inc.(略称:Pixie Dust Technologies)
発表年月日 2021-06-19
資料番号 SP2021-19
巻番号(vol) vol.121
号番号(no) SP-66
ページ範囲 pp.85-90(SP),
ページ数 6
発行日 2021-06-11 (SP)