講演名 2013-12-19
辞書選択型非負値行列因子分解による構音障害者の声質変換(声質変換,第15回音声言語シンポジウム)
相原 龍, 滝口 哲也, 有木 康雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,アテトーゼ型脳性麻痺による構音障害者を対象とし,筋肉の不随意運動を原因とする障害者の不安定な発話を聞き取りやすく変換することを目指す.従来の声質変換手法で最も一般的なのは,混合正規分布モデル(GMM)を用いた統計的手法であった.この手法は主に話者変換を目的として研究されてきたため,GMM声質変換を構音障害者の発話音声に適用し健常者の音声に変換した場合,障害者の話者性は別人のものに置き換わってしまう.「自分らしい声で話したい」という障害者のニーズに答えるため,本研究では従来の統計的モデルによる声質変換とは異なる,非負値行列因子分解(NMF)を用いたExemlpar-based声質変換を用いて,話者性を維持しつつ聞き取りやすい音声に変換する.これまでNMF声質変換では,入力音声フレームと,辞書から選ばれる基底の音素が必ずしも一致しないという問題があった.本研究では,この問題を解決するため,NMFを用いて音素カテゴリ認識を行い,音素カテゴリに分割した副辞書上でマッピングを行うことで声質変換を行う.提案手法の有効性を評価するため,従来のGMM声質変換,NMF声質変換との比較実験を行った.
抄録(英) We present in this paper a voice conversion (VC) method for a person with an articulation disorder resulting from athetoid cerebral palsy. The movement of such speakers is limited by their athetoid symptoms, and their consonants are often unstable or unclear, which makes it difficult for them to communicate. In our previous method, exemplar-based spectral conversion using Non-negative Matrix Factorization (NMF) was applied to a voice with an articulation disorder. To preserve the speaker's individuality, we used a combined dictionary that is constructed from the source speaker's vowels and target speaker's consonants. However, this exemplar-based approach needs to hold all the training exemplars (frames), and it may cause mismatching of phonemes between input signals and selected exemplars. In this paper, in order to reduce the mismatching of phoneme alignment, we propose a phoneme-categorized sub-dictionary and a dictionary selection method using NMF. By using the sub-dictionary, the performance of VC is improved compared to a conventional NMF-based VC. The effectiveness of this method was confirmed by comparing its effectiveness with that of a conventional Gaussian Mixture Model (GMM)-based method and a conventional NMF-based method.
キーワード(和) 声質変換 / 構音障害者 / 障害者支援 / 非負値行列因子分解 / 辞書選択
キーワード(英) Voice Conversion / Articulation Disorders / Asistive Technology / Non-negative Matrix Factorization / Sub-dictionary
資料番号 SP2013-86
発行日

研究会情報
研究会 SP
開催期間 2013/12/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 辞書選択型非負値行列因子分解による構音障害者の声質変換(声質変換,第15回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Voice Conversion for Articulation Disorders Using Dictionary Selective Non-negative Matrix Factorization
サブタイトル(和)
キーワード(1)(和/英) 声質変換 / Voice Conversion
キーワード(2)(和/英) 構音障害者 / Articulation Disorders
キーワード(3)(和/英) 障害者支援 / Asistive Technology
キーワード(4)(和/英) 非負値行列因子分解 / Non-negative Matrix Factorization
キーワード(5)(和/英) 辞書選択 / Sub-dictionary
第 1 著者 氏名(和/英) 相原 龍 / Ryo AIHARA
第 1 著者 所属(和/英) 神戸大学システム情報学研究科
Graduate School of System Informatics, Kobe University
第 2 著者 氏名(和/英) 滝口 哲也 / Tetsuya TAKIGUCHI
第 2 著者 所属(和/英) 神戸大学自然科学系先端融合研究環
Organization of Advanced Science and Technology, Kobe University
第 3 著者 氏名(和/英) 有木 康雄 / Yasuo ARIKI
第 3 著者 所属(和/英) 神戸大学自然科学系先端融合研究環
Organization of Advanced Science and Technology, Kobe University
発表年月日 2013-12-19
資料番号 SP2013-86
巻番号(vol) vol.113
号番号(no) 366
ページ範囲 pp.-
ページ数 6
発行日