講演抄録/キーワード |
講演名 |
2016-03-28 13:15
[ポスター講演]非負値行列因子分解を用いた欠損データ補間による超解像声道スペクトル推定 ○中村友彦(東大)・亀岡弘和(東大/NTT) EA2015-83 SIP2015-132 SP2015-111 |
抄録 |
(和) |
本報告では,音声信号から声道スペクトルを推定する問題を扱う.声道スペクトルは基本周波数($F_0$)間隔で周期的にサンプリングしたものと見なせるため,音声の$F_0$が高いほど声道スペクトル推定の手がかりは少なくなる.一方で,音声信号には同一の音素が繰り返し出現するため,類似した声道スペクトルが複数の異なる時刻で現れることも手がかりとなる.そのため,$F_0$の異なる複数のフレームが共通の声道スペクトルを持つと仮定できれば,複数のフレームの情報を用いることで声道スペクトル推定精度が向上するはずである.そこで,声道スペクトログラムが低ランクな非負値行列で表現できるという仮定を元に,声道スペクトル推定問題を欠損データのある非負値行列因子分解として定式化し,効率的なパラメータ推定アルゴリズムを導出する.評価実験により提案法の有効性を確認した. |
(英) |
This report addresses the problem of estimating vocal tract spectra from speech signals. Spectra of speech signals can be interpreted as vocal tract spectra sampled with a sampling period of $F_0$, and the higher $F_0$s are, the less observable harmonic components becomes. On the other hand, similar vocal tract spectra appear repeatedly due to multiple appearance of phonemes in speech signals. If we can assume that frames at which $F_0$s are different have common vocal tract spectra, the accuracy of vocal tract estimation may improve by making effective use of harmonic components in multiple frames. On the basis of the idea, with an assumption that vocal tract spectrograms can be represented by low-rank non-negative matrices, we formulate the problem of vocal tract estimation as non-negative matrix factorizations for missing data and derive an efficient parameter estimation algorithm. Experimental evaluation shows the effectiveness of the proposed method. |
キーワード |
(和) |
声道スペクトル推定 / 非負値行列因子分解 / 補助関数法 / / / / / |
(英) |
Vocal Tract Spectrum Estimation / Non-Negative Matrix Factorization / Auxiliary Function Approach / / / / / |
文献情報 |
信学技報, vol. 115, no. 523, SP2015-111, pp. 99-104, 2016年3月. |
資料番号 |
SP2015-111 |
発行日 |
2016-03-21 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2015-83 SIP2015-132 SP2015-111 |
研究会情報 |
研究会 |
EA SP SIP |
開催期間 |
2016-03-28 - 2016-03-29 |
開催地(和) |
別府国際コンベンションセンター B-ConPlaza |
開催地(英) |
Beppu International Convention Center B-ConPlaza |
テーマ(和) |
応用/電気音響,音声,信号処理,一般 |
テーマ(英) |
Engineering/Electro Acoustics, Speech, Signal Processing, and Related Topics |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2016-03-EA-SP-SIP |
本文の言語 |
日本語 |
タイトル(和) |
非負値行列因子分解を用いた欠損データ補間による超解像声道スペクトル推定 |
サブタイトル(和) |
|
タイトル(英) |
Super-Resolution Vocal Tract Spectrum Estimation with Missing Data Imputation Using Non-Negative Matrix Factorization |
サブタイトル(英) |
|
キーワード(1)(和/英) |
声道スペクトル推定 / Vocal Tract Spectrum Estimation |
キーワード(2)(和/英) |
非負値行列因子分解 / Non-Negative Matrix Factorization |
キーワード(3)(和/英) |
補助関数法 / Auxiliary Function Approach |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
中村 友彦 / Tomohiko Nakamura / ナカムラ トモヒコ |
第1著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: Todai) |
第2著者 氏名(和/英/ヨミ) |
亀岡 弘和 / Hirokazu Kameoka / カメオカ ヒロカズ |
第2著者 所属(和/英) |
東京大学/日本電信電話株式会社 (略称: 東大/NTT)
The University of Tokyo/Nippon Telegraph and Telephone Corporation (略称: Todai/NTT) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2016-03-28 13:15:00 |
発表時間 |
90分 |
申込先研究会 |
SP |
資料番号 |
EA2015-83, SIP2015-132, SP2015-111 |
巻番号(vol) |
vol.115 |
号番号(no) |
no.521(EA), no.522(SIP), no.523(SP) |
ページ範囲 |
pp.99-104 |
ページ数 |
6 |
発行日 |
2016-03-21 (EA, SIP, SP) |
|