講演抄録/キーワード |
講演名 |
2013-08-09 10:00
複素時間窓を利用した混合音声の分析手法の検討 ○伊藤 仁(東北工大)・伊藤彰則(東北大) EA2013-53 |
抄録 |
(和) |
有声音声や楽器音などの音響特性を,振幅と周波数が滑らかに時間変化する正弦波の和として近似する正弦波モデルは,音声の分析や合成など幅広い分野への応用が期待されている.一般に音声信号は基本周波数や声道伝達特性が時間変化する非定常信号であり,この様な信号を高い精度で再現する正弦波パラメータの推定は容易ではない.本稿では理論的な検討により,このパラメータ推定の障害を個々の正弦波成分のスペクトル歪みと,周波数軸上で近接する成分間の干渉の二つに分類した.このうち前者に対しては局所変化率変換を,後者に対しては複素窓関数を用いることで,非定常信号の正弦波パラメータを推定する新たな音響分析手法を提案した.音声信号や楽器音を入力とした性能評価実験の結果は,提案手法の有効性を支持するものであった.また,これらの混合音の分析結果から,複数の音響信号が混在する場合の正弦波パラメータ推定において提案手法が重要な基礎となる可能性が示唆された. |
(英) |
A sinusoidal representation of voiced speech is one of the promising methods for speech analysis and synthesis, which approximates the input signal to a sum of sinusoidal components of which frequency and amplitude continuously vary with time. The difficulty in estimating sinusoidal parameters from the input can be classified into two types: one is a spectral distortion induced by non-stationarity in the signal, while the other is an interferences among neighboring components in the spectrum.
To overcome the difficulties, a new analysis method is proposed which integrates the local vector transform and complex analysis window. The result of the experiment, in which sinusoidal parameters for single speech or tone of musical instrument were estimated, supported effectiveness of the proposed method. Further, the method could provide important basis in analyzing the mixture of these signals. |
キーワード |
(和) |
音声分析 / 正弦波モデル / 局所変化率変換 / 複素分析窓 / / / / |
(英) |
Speech analysis / Sinusoidal model / Local vector transform / Complex window function / / / / |
文献情報 |
信学技報, vol. 113, no. 177, EA2013-53, pp. 1-6, 2013年8月. |
資料番号 |
EA2013-53 |
発行日 |
2013-08-02 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2013-53 |
研究会情報 |
研究会 |
EA |
開催期間 |
2013-08-09 - 2013-08-09 |
開催地(和) |
東北大学 |
開催地(英) |
Tohoku University |
テーマ(和) |
音響信号処理,聴覚,一般 |
テーマ(英) |
Acoustic Signal Processing, Psychological and Physiological Acoustics, and Related Topics |
講演論文情報の詳細 |
申込み研究会 |
EA |
会議コード |
2013-08-EA |
本文の言語 |
日本語 |
タイトル(和) |
複素時間窓を利用した混合音声の分析手法の検討 |
サブタイトル(和) |
|
タイトル(英) |
An acoustical analysis for mixed speech signals using a complex window function |
サブタイトル(英) |
|
キーワード(1)(和/英) |
音声分析 / Speech analysis |
キーワード(2)(和/英) |
正弦波モデル / Sinusoidal model |
キーワード(3)(和/英) |
局所変化率変換 / Local vector transform |
キーワード(4)(和/英) |
複素分析窓 / Complex window function |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
伊藤 仁 / Masashi Ito / イトウ マサシ |
第1著者 所属(和/英) |
東北工業大学 (略称: 東北工大)
Tohoku Institute of Technology (略称: Tohoku Inst. of Tech.) |
第2著者 氏名(和/英/ヨミ) |
伊藤 彰則 / Akinori Ito / イトウ アキノリ |
第2著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2013-08-09 10:00:00 |
発表時間 |
30分 |
申込先研究会 |
EA |
資料番号 |
EA2013-53 |
巻番号(vol) |
vol.113 |
号番号(no) |
no.177 |
ページ範囲 |
pp.1-6 |
ページ数 |
6 |
発行日 |
2013-08-02 (EA) |