講演名 2011-12-19
セグメンタルNMFによる音声分析合成における基底行列圧縮の検討(ポスターセッション,第13回音声言語シンポジウム)
李 哲, 間野 一則,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,セグメント単位の非負値行列因子分解(セグメンタルNMF)を用いた音声分析合成符号化システムを目的とし,セグメンタルNMFによって生成される基底行列をより簡潔に表現する圧縮方法を提案する.非負値制約を用いて行列を分解し,特徴抽出を行う非負値行列因子分解手法を各音素の特徴に基づいてクラスタ化したSTRAIGHTのスペクトル包絡系列に適用し,基底行列を求める.符号化を考えた場合に,従来のSTRAIGHTのスペクトル包絡系列における各基底の次元数が513次でありメモリ量の大きさが問題となる.STRAIGHTスペクトル包絡系列の基底行列は,非常にスパースであるので,少数のガウス混合分布により近似表現について検討した.
抄録(英) We have proposed an analysis-synthesis method by using non-negative matrix factorization in phoneme-wise speech segments (segmental NMF). In this paper, a concise representation of a matrix of basis functions of STRAIGHT spectral envelopes is proposed to reduce the number of dimensions of the NMF basis functions. Non-negative matrix factorization technique decomposes a matrix of STRAIGHT spectrum envelope sequences into a basis matrix and a weighting matrix, both of which have non-negative elements. The conventional STRAIGHT power spectrum has 513 dimensions, which requires large amount of memory spaces. According to our previous research, the obtained basis matrix for each segmental STRAIGHT spectrum has very sparse components, and it is expected that such a matrix can be represented by simple combinations of some Gaussian mixture distributions. Some preliminary results of the approximation of the basis functions are discussed.
キーワード(和) 音声セグメント / 非負値行列因子分解 / STRAIGHT / ガウス混合分布
キーワード(英) speech segment / non-negative matrix factorization / STRAIGHT / Gaussian mixture distributions
資料番号 NLC2011-40,SP2011-85
発行日

研究会情報
研究会 SP
開催期間 2011/12/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) セグメンタルNMFによる音声分析合成における基底行列圧縮の検討(ポスターセッション,第13回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Concise representation of a matrix of basis functions for speech analysis and synthesis by using segmental NMF
サブタイトル(和)
キーワード(1)(和/英) 音声セグメント / speech segment
キーワード(2)(和/英) 非負値行列因子分解 / non-negative matrix factorization
キーワード(3)(和/英) STRAIGHT / STRAIGHT
キーワード(4)(和/英) ガウス混合分布 / Gaussian mixture distributions
第 1 著者 氏名(和/英) 李 哲 / Cheol LEE
第 1 著者 所属(和/英) 芝浦工業大学システム理工学部
College of Systems Engineering and Science, Shibaura Institute of Technology
第 2 著者 氏名(和/英) 間野 一則 / Kazunori MANO
第 2 著者 所属(和/英) 芝浦工業大学システム理工学部
College of Systems Engineering and Science, Shibaura Institute of Technology
発表年月日 2011-12-19
資料番号 NLC2011-40,SP2011-85
巻番号(vol) vol.111
号番号(no) 365
ページ範囲 pp.-
ページ数 6
発行日