講演名 2021-12-03
感情次元の操作を目的とした声質変換手法の提案
向田 圭汰(宇都宮大), 森 大毅(宇都宮大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 感情次元による連続的な感情表記法に基づいた声質変換手法を提案する.一般的な離散的な感情表記法に基づく感情の声質変換は,変換元と変換先の感情状態に対応するコーパスを用意して学習する.しかし,次元に基づく連続的な感情表記法ではデータセットを変換元と変換先に分割することはできない.本報告では,変換元と変換先の感情次元の差分をサンプリングにより生成することで声質変換モデルを学習する方法を提案する.このモデルは声質変換を担うGeneratorと変換音声の肉声らしさを検査するDiscriminatorの競合学習に基づく.Generatorには音声の特徴量に加え変換先への感情次元の差分を入力する.Discriminatorには音声の特徴量に加えその感情次元を入力し,音声の肉声らしさとその感情次元の妥当性を判別する.
抄録(英) We propose an emotional voice conversion method based on the emotion dimensions. Conventional emotional voice conversion assumes a dataset that consists of disjoint subsets of categorical emotion. However, it is impossible to divide the dataset into the source domain and the target domain when adopting the emotion dimensions. In this paper, we propose a method of constructing an emotional voice conversion model by the sampling of the difference to the target emotion over the dimensional space of emotion. The model is based on the competitive learning of the Generator that performs the voice conversion, and the Discriminator that assesses the genuineness of the converted speech. The Generator receives the speech features as well as the difference of emotion dimensions to the target emotional states. The Discriminator receives the speech features as well as the emotion dimensions of the speech, to check whether the emotion is being expressed by the input speech.
キーワード(和) 声質変換 / 感情次元 / GAN / 自発音声
キーワード(英) Voice conversion / Emotion dimensions / GAN / Spontaneous speech
資料番号 NLC2021-25,SP2021-46
発行日 2021-11-24 (NLC, SP)

研究会情報
研究会 NLC / IPSJ-NL / SP / IPSJ-SLP
開催期間 2021/12/1(から3日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 第23回音声言語シンポジウムおよび第8回自然言語処理シンポジウム
テーマ(英)
委員長氏名(和) 嶋田 和孝(九工大) / 関根 聡(理化学研究所) / 北岡 教英(豊橋技科大) / 北岡 教英(豊橋技術科学大学)
委員長氏名(英) Kazutaka Shimada(Kyushu Inst. of Tech.) / 関根 聡(理化学研究所) / Norihide Kitaoka(Toyohashi Univ. of Tec) / 北岡 教英(豊橋技術科学大学)
副委員長氏名(和) 吉田 光男(豊橋技科大) / 小早川 健(NHK)
副委員長氏名(英) Mitsuo Yoshida(Toyohashi Univ. of Tech.) / Takeshi Kobayakawa(NHK)
幹事氏名(和) 坂地 泰紀(東大) / 石野 亜耶(広島経済大) / 内海 慶(株式会社デンソーアイティーラボラトリ) / 内田 ゆず(北海学園大学) / 木村 泰知(小樽商科大学) / 古宮 嘉那子(東京農工大学) / 高道 慎之介(東大) / 高島 遼一(神戸大) / 秋田 祐哉(京都大学) / 太刀岡 勇気(デンソーアイティーラボラトリ) / 高島 遼一(神戸大学) / 高道 慎之介(東京大学)
幹事氏名(英) Hiroki Sakaji(Univ. of Tokyo) / Aya Ishino(Hiroshima Univ. of Economics) / 内海 慶(株式会社デンソーアイティーラボラトリ) / 内田 ゆず(北海学園大学) / 木村 泰知(小樽商科大学) / 古宮 嘉那子(東京農工大学) / Shinnosuke Takamichi(Univ. of Tokyo) / Ryouichi Takashima(Kobe Univ.) / 秋田 祐哉(京都大学) / 太刀岡 勇気(デンソーアイティーラボラトリ) / 高島 遼一(神戸大学) / 高道 慎之介(東京大学)
幹事補佐氏名(和) 高橋 寛治(Sansan) / 光田 航(NTT) / 笹野 遼平(名古屋大学) / 須藤 克仁(奈良先端科学技術大学院大学) / 横野 光(明星大学) / 吉野 幸一郎(理化学研究所) / 中鹿 亘(電通大) / 増村 亮(NTT)
幹事補佐氏名(英) Kanji Takahashi(Sansan) / Koh Mitsuda(NTT) / 笹野 遼平(名古屋大学) / 須藤 克仁(奈良先端科学技術大学院大学) / 横野 光(明星大学) / 吉野 幸一郎(理化学研究所) / Toru Nakashika(Univ. of Electro-Comm.) / Ryo Masumura(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication / Special Interest Group on Natural Language / Technical Committee on Speech / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) 感情次元の操作を目的とした声質変換手法の提案
サブタイトル(和)
タイトル(英) An approach to voice conversion for manipulating emotion dimensions
サブタイトル(和)
キーワード(1)(和/英) 声質変換 / Voice conversion
キーワード(2)(和/英) 感情次元 / Emotion dimensions
キーワード(3)(和/英) GAN / GAN
キーワード(4)(和/英) 自発音声 / Spontaneous speech
第 1 著者 氏名(和/英) 向田 圭汰 / Keita Mukada
第 1 著者 所属(和/英) 宇都宮大学(略称:宇都宮大)
Utsunomiya University(略称:Utsunomiya Univ.)
第 2 著者 氏名(和/英) 森 大毅 / Hiroki Mori
第 2 著者 所属(和/英) 宇都宮大学(略称:宇都宮大)
Utsunomiya University(略称:Utsunomiya Univ.)
発表年月日 2021-12-03
資料番号 NLC2021-25,SP2021-46
巻番号(vol) vol.121
号番号(no) NLC-281,SP-282
ページ範囲 pp.39-41(NLC), pp.39-41(SP),
ページ数 3
発行日 2021-11-24 (NLC, SP)