講演名 2016-03-28
[ポスター講演]非負値行列因子分解を用いた欠損データ補間による超解像声道スペクトル推定
中村 友彦(東大), 亀岡 弘和(東大/NTT),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では,音声信号から声道スペクトルを推定する問題を扱う.声道スペクトルは基本周波数($F_0$)間隔で周期的にサンプリングしたものと見なせるため,音声の$F_0$が高いほど声道スペクトル推定の手がかりは少なくなる.一方で,音声信号には同一の音素が繰り返し出現するため,類似した声道スペクトルが複数の異なる時刻で現れることも手がかりとなる.そのため,$F_0$の異なる複数のフレームが共通の声道スペクトルを持つと仮定できれば,複数のフレームの情報を用いることで声道スペクトル推定精度が向上するはずである.そこで,声道スペクトログラムが低ランクな非負値行列で表現できるという仮定を元に,声道スペクトル推定問題を欠損データのある非負値行列因子分解として定式化し,効率的なパラメータ推定アルゴリズムを導出する.評価実験により提案法の有効性を確認した.
抄録(英) This report addresses the problem of estimating vocal tract spectra from speech signals. Spectra of speech signals can be interpreted as vocal tract spectra sampled with a sampling period of $F_0$, and the higher $F_0$s are, the less observable harmonic components becomes. On the other hand, similar vocal tract spectra appear repeatedly due to multiple appearance of phonemes in speech signals. If we can assume that frames at which $F_0$s are different have common vocal tract spectra, the accuracy of vocal tract estimation may improve by making effective use of harmonic components in multiple frames. On the basis of the idea, with an assumption that vocal tract spectrograms can be represented by low-rank non-negative matrices, we formulate the problem of vocal tract estimation as non-negative matrix factorizations for missing data and derive an efficient parameter estimation algorithm. Experimental evaluation shows the effectiveness of the proposed method.
キーワード(和) 声道スペクトル推定 / 非負値行列因子分解 / 補助関数法
キーワード(英) Vocal Tract Spectrum Estimation / Non-Negative Matrix Factorization / Auxiliary Function Approach
資料番号 EA2015-83,SIP2015-132,SP2015-111
発行日 2016-03-21 (EA, SIP, SP)

研究会情報
研究会 EA / SP / SIP
開催期間 2016/3/28(から2日開催)
開催地(和) 別府国際コンベンションセンター B-ConPlaza
開催地(英) Beppu International Convention Center B-ConPlaza
テーマ(和) 応用/電気音響,音声,信号処理,一般
テーマ(英) Engineering/Electro Acoustics, Speech, Signal Processing, and Related Topics
委員長氏名(和) 羽田 陽一(電通大) / 間野 一則(芝浦工大) / 宝珠山 治(NEC)
委員長氏名(英) Yoichi Haneda(Univ. of Electro-Comm.) / Kazunori Mano(Shibaura Inst. of Tech.) / Osamu Houshuyama(NEC)
副委員長氏名(和) 岩谷 幸雄(東北学院大) / 水町 光徳(九工大) / 北岡 教英(徳島大) / 中静 真(千葉工大) / 奥田 正浩(北九州市大)
副委員長氏名(英) Yukio Iwaya(Tohoku Gakuin Univ.) / Mitsunori Mizumachi(Kyushu Inst. of Tech.) / Norihide Kitaoka(Tokushima Univ.) / Makoto Nakashizuka(Chiba Inst. of Tech.) / Masahiro Okuda(Univ. of Kitakyushu)
幹事氏名(和) 島内 末廣(NTT) / 堀内 俊治(KDDI研) / 岩野 公司(東京都市大) / 滝口 哲也(神戸大) / 辻川 剛範(NEC) / 平林 晃(立命館大)
幹事氏名(英) Suehiro Shimauchi(NTT) / Toshiharu Horiuchi(KDDI R&D Labs.) / Koji Iwano(Tokyo City Univ.) / Tetsuya Takiguchi(Kobe Univ.) / Masanori Tsujikawa(NEC) / Akira Hirabayashi(Ritsumeikan Univ.)
幹事補佐氏名(和) 小山 翔一(東大) / 能勢 隆(東北大) / 浅見 太一(NTT) / 宮田 高道(千葉工大)
幹事補佐氏名(英) Shoichi Koyama(Univ. of Tokyo) / Takashi Nose(Tohoku Univ.) / Taichi Asami(NTT) / Takamichi Miyata(Chiba Inst. of Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Technical Committee on Speech / Technical Committee on Signal Processing
本文の言語 JPN
タイトル(和) [ポスター講演]非負値行列因子分解を用いた欠損データ補間による超解像声道スペクトル推定
サブタイトル(和)
タイトル(英) [Poster Presentation] Super-Resolution Vocal Tract Spectrum Estimation with Missing Data Imputation Using Non-Negative Matrix Factorization
サブタイトル(和)
キーワード(1)(和/英) 声道スペクトル推定 / Vocal Tract Spectrum Estimation
キーワード(2)(和/英) 非負値行列因子分解 / Non-Negative Matrix Factorization
キーワード(3)(和/英) 補助関数法 / Auxiliary Function Approach
第 1 著者 氏名(和/英) 中村 友彦 / Tomohiko Nakamura
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Todai)
第 2 著者 氏名(和/英) 亀岡 弘和 / Hirokazu Kameoka
第 2 著者 所属(和/英) 東京大学/日本電信電話株式会社(略称:東大/NTT)
The University of Tokyo/Nippon Telegraph and Telephone Corporation(略称:Todai/NTT)
発表年月日 2016-03-28
資料番号 EA2015-83,SIP2015-132,SP2015-111
巻番号(vol) vol.115
号番号(no) EA-521,SIP-522,SP-523
ページ範囲 pp.99-104(EA), pp.99-104(SIP), pp.99-104(SP),
ページ数 6
発行日 2016-03-21 (EA, SIP, SP)