講演抄録/キーワード |
講演名 |
2010-12-21 16:40
音声セグメントを考慮したSTRAIGHTスペクトログラムの非負値行列因子分解 ○小関 真・間野一則(芝浦工大) NLC2010-27 SP2010-100 |
抄録 |
(和) |
本稿では,STRAIGHTにおけるスペクトログラムの圧縮のための音声のセグメントに着目した非負値行列因子分解の新しい枠組みを提案する.非負値行列因子分解は,非負値制約を用いて行列を分解する手法であり,初期値の設定手法や制約条件により分解された行列に特徴を持たせることができる.しかし,非負値行列因子分解を例えば一文の音声のスペクトログラム全体に適用した場合,スペクトログラム全体での因子分解の誤差最小化を行うため,音素によってスペクトルのレベルが高い場合,その音素に重みが偏ってしまう.レベルが高いスペクトルはよく近似できるが,レベルが低いスペクトルは重みが偏ってしまうことで最適な値に近似できない可能性がある.そこで,音声セグメントの特徴に基づいてクラスタ化し,クラスタごとに最適な基底スペクトルを定めスペクトログラムをモデル化する. |
(英) |
In this paper, we propose a new framework of non-negative matrix factorization (NMF) applied to segmental speech for spectrogram compression in STRAIGHT. Non-negative matrix factorization is a matrix decomposition method using non-negative constraints, and it is possible to extract various characteristic features as the form of decomposed matrix by controlling the initial values and the constraints of optimization measures. If an NMF is applied to a whole sentence, higher levels of some specific phoneme spectra would be involuntarily biased. In this case, although the higher-level spectra can be well approximated, the lower-level spectra may not be well approximated. The proposed method performs NMF based on the characteristics of speech segments. It is shown that the obtained spectrogram model provides better basis spectra for each cluster than normal NMF and mel-cepstral representations. |
キーワード |
(和) |
STRAIGHT / 非負値行列因子分解 / 音声セグメント / / / / / |
(英) |
STRAIGHT / Non-negative Matrix Factorization / speech segment / / / / / |
文献情報 |
信学技報, vol. 110, no. 357, SP2010-100, pp. 183-188, 2010年12月. |
資料番号 |
SP2010-100 |
発行日 |
2010-12-13 (NLC, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2010-27 SP2010-100 |
研究会情報 |
研究会 |
NLC SP |
開催期間 |
2010-12-20 - 2010-12-21 |
開催地(和) |
国立オリンピック記念青少年総合センター |
開催地(英) |
National Olympics Memorial Youth Center |
テーマ(和) |
第12回音声言語シンポジウム: 情報アクセス,音声・言語処理一般 (SLP研と連立開催) |
テーマ(英) |
Information Access, Speech and Language Processing, etc. |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2010-12-NLC-SP |
本文の言語 |
日本語 |
タイトル(和) |
音声セグメントを考慮したSTRAIGHTスペクトログラムの非負値行列因子分解 |
サブタイトル(和) |
|
タイトル(英) |
Non-negative matrix factorization of segmental STRAIGHT speech spectrograms |
サブタイトル(英) |
|
キーワード(1)(和/英) |
STRAIGHT / STRAIGHT |
キーワード(2)(和/英) |
非負値行列因子分解 / Non-negative Matrix Factorization |
キーワード(3)(和/英) |
音声セグメント / speech segment |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
小関 真 / Makoto Koseki / コセキ マコト |
第1著者 所属(和/英) |
芝浦工業大学 (略称: 芝浦工大)
Shibaura Institute of Technology (略称: Shibaura Inst. of Tech.) |
第2著者 氏名(和/英/ヨミ) |
間野 一則 / Kazunori Mano / |
第2著者 所属(和/英) |
芝浦工業大学 (略称: 芝浦工大)
Shibaura Institute of Technology (略称: Shibaura Inst. of Tech.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2010-12-21 16:40:00 |
発表時間 |
90分 |
申込先研究会 |
SP |
資料番号 |
NLC2010-27, SP2010-100 |
巻番号(vol) |
vol.110 |
号番号(no) |
no.356(NLC), no.357(SP) |
ページ範囲 |
pp.183-188 |
ページ数 |
6 |
発行日 |
2010-12-13 (NLC, SP) |
|