お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2013-08-09 10:00
複素時間窓を利用した混合音声の分析手法の検討
伊藤 仁東北工大)・伊藤彰則東北大EA2013-53
抄録 (和) 有声音声や楽器音などの音響特性を,振幅と周波数が滑らかに時間変化する正弦波の和として近似する正弦波モデルは,音声の分析や合成など幅広い分野への応用が期待されている.一般に音声信号は基本周波数や声道伝達特性が時間変化する非定常信号であり,この様な信号を高い精度で再現する正弦波パラメータの推定は容易ではない.本稿では理論的な検討により,このパラメータ推定の障害を個々の正弦波成分のスペクトル歪みと,周波数軸上で近接する成分間の干渉の二つに分類した.このうち前者に対しては局所変化率変換を,後者に対しては複素窓関数を用いることで,非定常信号の正弦波パラメータを推定する新たな音響分析手法を提案した.音声信号や楽器音を入力とした性能評価実験の結果は,提案手法の有効性を支持するものであった.また,これらの混合音の分析結果から,複数の音響信号が混在する場合の正弦波パラメータ推定において提案手法が重要な基礎となる可能性が示唆された. 
(英) A sinusoidal representation of voiced speech is one of the promising methods for speech analysis and synthesis, which approximates the input signal to a sum of sinusoidal components of which frequency and amplitude continuously vary with time. The difficulty in estimating sinusoidal parameters from the input can be classified into two types: one is a spectral distortion induced by non-stationarity in the signal, while the other is an interferences among neighboring components in the spectrum.
To overcome the difficulties, a new analysis method is proposed which integrates the local vector transform and complex analysis window. The result of the experiment, in which sinusoidal parameters for single speech or tone of musical instrument were estimated, supported effectiveness of the proposed method. Further, the method could provide important basis in analyzing the mixture of these signals.
キーワード (和) 音声分析 / 正弦波モデル / 局所変化率変換 / 複素分析窓 / / / /  
(英) Speech analysis / Sinusoidal model / Local vector transform / Complex window function / / / /  
文献情報 信学技報, vol. 113, no. 177, EA2013-53, pp. 1-6, 2013年8月.
資料番号 EA2013-53 
発行日 2013-08-02 (EA) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EA2013-53

研究会情報
研究会 EA  
開催期間 2013-08-09 - 2013-08-09 
開催地(和) 東北大学 
開催地(英) Tohoku University 
テーマ(和) 音響信号処理,聴覚,一般 
テーマ(英) Acoustic Signal Processing, Psychological and Physiological Acoustics, and Related Topics 
講演論文情報の詳細
申込み研究会 EA 
会議コード 2013-08-EA 
本文の言語 日本語 
タイトル(和) 複素時間窓を利用した混合音声の分析手法の検討 
サブタイトル(和)  
タイトル(英) An acoustical analysis for mixed speech signals using a complex window function 
サブタイトル(英)  
キーワード(1)(和/英) 音声分析 / Speech analysis  
キーワード(2)(和/英) 正弦波モデル / Sinusoidal model  
キーワード(3)(和/英) 局所変化率変換 / Local vector transform  
キーワード(4)(和/英) 複素分析窓 / Complex window function  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 伊藤 仁 / Masashi Ito / イトウ マサシ
第1著者 所属(和/英) 東北工業大学 (略称: 東北工大)
Tohoku Institute of Technology (略称: Tohoku Inst. of Tech.)
第2著者 氏名(和/英/ヨミ) 伊藤 彰則 / Akinori Ito / イトウ アキノリ
第2著者 所属(和/英) 東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2013-08-09 10:00:00 
発表時間 30分 
申込先研究会 EA 
資料番号 EA2013-53 
巻番号(vol) vol.113 
号番号(no) no.177 
ページ範囲 pp.1-6 
ページ数
発行日 2013-08-02 (EA) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会