お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2017-03-02 12:45
無矛盾逐次変換ネットワークと敵対的生成ネットワークを用いた非母語話者音声変換
小山田圭佑筑波大)・亀岡弘和金子卓弘NTT)・安東弘泰筑波大)・平松 薫柏野邦夫NTTEA2016-139 SIP2016-194 SP2016-134
抄録 (和) 本稿では,非母語話者音声を母語話者らしい発音の音声に自動変換する問題を扱う.
非母語話者の発音の癖や傾向は前後の文脈(例えば単語)に多分に依存するため,
フレームごとの特徴量ではなく
連続するフレームの特徴量の系列に対し変換則を学習する機構が必要である.
本研究では,
特徴量の局所的な系列から系列への変換をオンラインで行えるようにするため,
各セグメント内の特徴量を連結したベクトル(セグメント特徴量)を入
出力としたニューラルネットワーク(Neural Network; NN)を考え,さらに特徴量の
大域的な連続性を保証するため,
セグメントの重複区間における変換特徴量が矛盾しないような機構を備えたNNのアーキテクチャを提案する.
また,このNNにより生成される変換特徴量系列に対し敵対的生成ネットワーク(Generative Adversarial Network; GAN)を用いたポストフィルタリング手法を適用し,その効果も併せて確認する.
主観および客観評価実験により
提案法と従来法による変換音声の比較検証を行い,提案法の有効性を確認した. 
(英) This paper deals with the problem of automatically modifying the pronunciation of non-native speech.
Since the pronunciation characteristics of non-native speakers tend to depend heavily on the context (such as words), conversion rules must be learned from and applied to
a sequence of features rather than a single-frame feature.
This paper proposes constructing a neural network that allows
a sequence of features as an input and an output, and guarantees
the consistency between the generated features within overlapping segments.
We further propose applying a recently proposed generative adversarial network (GAN)-based post filter
to the generated feature sequence with the aim of synthesizing natural sounding speech.
Through subjective and quantitative evaluations, we confirmed the superiority of the proposed method over a conventional NN approach in terms of the conversion quality.
キーワード (和) 非母語話者音声変換 / 声質変換 / 深層学習 / 敵対的生成ネットワーク / / / /  
(英) / / / / / / /  
文献情報 信学技報, vol. 116, no. 477, SP2016-134, pp. 315-320, 2017年3月.
資料番号 SP2016-134 
発行日 2017-02-22 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EA2016-139 SIP2016-194 SP2016-134

研究会情報
研究会 SP SIP EA  
開催期間 2017-03-01 - 2017-03-02 
開催地(和) 沖縄産業支援センター 
開催地(英) Okinawa Industry Support Center 
テーマ(和) 音声,応用/電気音響,信号処理,一般 
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2017-03-SP-SIP-EA 
本文の言語 日本語 
タイトル(和) 無矛盾逐次変換ネットワークと敵対的生成ネットワークを用いた非母語話者音声変換 
サブタイトル(和)  
タイトル(英) Non-native speech conversion with consistency-aware recursive network and generative adversarial network 
サブタイトル(英)  
キーワード(1)(和/英) 非母語話者音声変換 /  
キーワード(2)(和/英) 声質変換 /  
キーワード(3)(和/英) 深層学習 /  
キーワード(4)(和/英) 敵対的生成ネットワーク /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 小山田 圭佑 / Keisuke Oyamada / オヤマダ ケイスケ
第1著者 所属(和/英) 筑波大学 (略称: 筑波大)
University of Tsukuba (略称: Univ. of Tsukuba)
第2著者 氏名(和/英/ヨミ) 亀岡 弘和 / Hirokazu Kameoka / カメオカ ヒロカズ
第2著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第3著者 氏名(和/英/ヨミ) 金子 卓弘 / Takuhiro Kaneko / カネコ タクヒロ
第3著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第4著者 氏名(和/英/ヨミ) 安東 弘泰 / Hiroyasu Ando / アンドウ ヒロヤス
第4著者 所属(和/英) 筑波大学 (略称: 筑波大)
University of Tsukuba (略称: Univ. of Tsukuba)
第5著者 氏名(和/英/ヨミ) 平松 薫 / Kaoru Hiramatsu / ヒラマツ カオル
第5著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第6著者 氏名(和/英/ヨミ) 柏野 邦夫 / Kunio Kashino / カシノ クニオ
第6著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2017-03-02 12:45:00 
発表時間 25分 
申込先研究会 SP 
資料番号 EA2016-139, SIP2016-194, SP2016-134 
巻番号(vol) vol.116 
号番号(no) no.475(EA), no.476(SIP), no.477(SP) 
ページ範囲 pp.315-320 
ページ数
発行日 2017-02-22 (EA, SIP, SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会