講演抄録/キーワード |
講演名 |
2014-12-16 11:00
Multiple Non-negative Matrix Factorizationを用いた多対一声質変換 ○相原 龍・滝口哲也・有木康雄(神戸大) SP2014-114 |
抄録 |
(和) |
本報告では,非負値行列因子分解(NMF)を拡張したMultiple Non-negative Matrix Factorization (Multi-NMF)を提案し,任意話者の発話を特定話者の発話へと変換する多対一声質変換を行う.従来,声質変換は入力話者の声質を出力話者のものへ変換する話者変換を目的として広く研究されてきた.声質変換において最も一般的な手法は混合正規分布モデル(GMM)を用いた統計的手法であり,統計的声質変換の枠組みは複数の事前収録話者から構成されるパラレルデータセットを用いて,任意の話者から他の任意の話者への変換へと拡張されている.一方,統計的声質変換に代わる手法としてNMF を用いたExemplar-based声質変換がある.この手法は,NMFが有する雑音除去機能と,Exemplar-based手法がもつ変換音声の自然性保持という利点から研究が進められている.しかしながら,NMF声質変換においては入力話者と出力話者のパラレルデータの存在が前提であり,これまでは任意話者からの声質変換は不可能であった.そこで本報告では,Multi-NMFによる,入力話者の発話データを学習せずとも変換できる多対一声質変換を提案する.入力話者の発話スペクトルは,事前に学習された複数の話者の発話スペクトルの線形和で表現され,その結合重み係数を用いて目標話者の発話スペクトルへと変換される.この手法は,多対多声質変換や,話者性を制御可能な声質変換へと応用可能であると考えられる. |
(英) |
Voice conversion (VC) is being widely researched in the field of speech processing because of increased interest in using such processing in applications such as personalized Text-To-Speech systems. Statistical approach using Gaussian Mixture Model (GMM) is widely researched in VC and eigen-voice GMM enables one-to-many and many-to-one VC from multiple training data sets. We present in this paper an exemplar-based VC method using Non-negative Matrix Factorization (NMF), which is different from conventional statistical VC. NMF-based VC has advantages of noise robustness and naturalness of converted voice compared to GMM-based VC. However, because NMF-based VC is based on parallel training data of source and target speaker, we cannot covert voice of arbitrary speakers in this framework. In this paper, we propose a many-to-one VC using Multiple Non-negative Matrix Factorization (Multi-NMF). By using Multi-NMF, arbitrary speaker's voice is converted to target speaker's voice without any training data of input speaker's. We assume that this method is flexible because we can adopt it to many-to-many VC or voice quality control. |
キーワード |
(和) |
声質変換 / 音声合成 / 非負値行列因子分解 / Exemplar-based / 多対一 / / / |
(英) |
Voice Conversion / Speech synthesis / Non-negative Matrix Factorization / Exemplar-based / Many-to-one / / / |
文献情報 |
信学技報, vol. 114, no. 365, SP2014-114, pp. 75-80, 2014年12月. |
資料番号 |
SP2014-114 |
発行日 |
2014-12-08 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2014-114 |
研究会情報 |
研究会 |
NLC IPSJ-NL SP IPSJ-SLP JSAI-SLUD |
開催期間 |
2014-12-15 - 2014-12-17 |
開催地(和) |
東工大(すずかけ台) |
開催地(英) |
Tokyo Institute of Technology (Suzukakedai Campus) |
テーマ(和) |
第6回集合知シンポジウム |
テーマ(英) |
The 6th Symposium on Collective Knowlege |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2014-12-NLC-NL-SP-SLP-SLUD |
本文の言語 |
日本語 |
タイトル(和) |
Multiple Non-negative Matrix Factorizationを用いた多対一声質変換 |
サブタイトル(和) |
|
タイトル(英) |
Many-to-one Voice Conversion using Multiple Non-negative Matrix Factorization |
サブタイトル(英) |
|
キーワード(1)(和/英) |
声質変換 / Voice Conversion |
キーワード(2)(和/英) |
音声合成 / Speech synthesis |
キーワード(3)(和/英) |
非負値行列因子分解 / Non-negative Matrix Factorization |
キーワード(4)(和/英) |
Exemplar-based / Exemplar-based |
キーワード(5)(和/英) |
多対一 / Many-to-one |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
相原 龍 / Ryo Aihara / アイハラ リョウ |
第1著者 所属(和/英) |
神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.) |
第2著者 氏名(和/英/ヨミ) |
滝口 哲也 / Tetsuya Takiguchi / タキグチ テツヤ |
第2著者 所属(和/英) |
神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.) |
第3著者 氏名(和/英/ヨミ) |
有木 康雄 / Yasuo Ariki / アリキ ヤスオ |
第3著者 所属(和/英) |
神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2014-12-16 11:00:00 |
発表時間 |
90分 |
申込先研究会 |
SP |
資料番号 |
SP2014-114 |
巻番号(vol) |
vol.114 |
号番号(no) |
no.365 |
ページ範囲 |
pp.75-80 |
ページ数 |
6 |
発行日 |
2014-12-08 (SP) |