講演抄録/キーワード |
講演名 |
2019-03-15 13:30
[ポスター講演]正則化線形予測に基づく時変複素音声分析を用いたF0推定 ○舟木慶一(琉球大) EA2018-152 SIP2018-158 SP2018-114 |
抄録 |
(和) |
音声の線形予測 (LP) は音声のスペクトルを 10 数個の AR(自己回帰) 係数で記述できる音声符号化の基
本となる方式であり、F0 推定や音声強調のみならず、近年は音声合成にも適用されている。我々は、LP 分析を複素
分析と時変分析に拡張した解析信号に対する時変複素音声分析の提案とその音声処理への適用を行っている。すで
に、l2 ノルム最適化方式である MMSE 分析や拡大最小 2 乗法 (ELS) などの提案を行っている。一方、l2 ノルム正
則化に基づく LP(RLP) 分析も B.Kleijn らにより提案されている。これは F0 が高い場合に第 1 フォルマントが過小
推定される推定誤りを減らすために、l2 ノルムにスペクトルの周波数軸上の変動分を表す l2 ノルム正則化項を足し
合わせた評価基準を最小化するようにパラメータ推定を行う方式である。また、最近、P.Aklu らにより時間正則化
LP(Time-Regilarized LP: TRLP) 分析が提案されている。これは、隣接フレーム間でのパラメータの変動分の l2 ノ
ルムを正則化項とする方式である。本稿では、TV-CAR 分析に RLP を導入した音声分析法を構築し、複素残差を入
力とする IRAPT を用いた音声の F0 推定によりその性能評価を行う。 |
(英) |
Linear Prediction (LP) analysis is speech analysis to estimate AR(Auto-Regressive) coefficients to represent the all-pole spectrum that is based on speech coding and recently is applied also in speech synthesis. We
have proposed TV-CAR(Time-Varying Complex AR) speech analysis and have applied it into the speech processing
such as robust ASR or F0 estimation of speech. We have proposed l2-norm optimization-based TV-CAR speech
analysis for an analytic signal that includes MMSE(Minimizing Mean Square Error) or ELS(Extended Least Square)
method. On the other hand, B.Kleijn et al. have proposed a Regularized Linear Prediction (RLP) method. In the
RLP, l2 regularized term that means spectral variant in the frequencies to avoid pitch related bias is introduced.
The parameter is estimated so as to minimize the l2-norm criterion added by the l2-regularized penalty term. Moreover,
P.Alku et al. have proposed Time-Regularized LP (TRLP) analysis. In the TRLP, the regularized term is set as the
l2-norm of the difference between the current parameters and previous ones. In this paper, the RLP-based TV-CAR
speech analysis is proposed and evaluated with the F0 estimation of speech using IRAPT. |
キーワード |
(和) |
時変複素分析 / 解析信号 / l2 ノルム正則化 / 音声の F0 推定 / IRAPT / / / |
(英) |
Time-Varying Complex AR(TV-CAR) analysis / Analytic signal / l2-norm regularization / F0 estimation of speech / IRAPT / / / |
文献情報 |
信学技報, vol. 118, no. 497, SP2018-114, pp. 311-316, 2019年3月. |
資料番号 |
SP2018-114 |
発行日 |
2019-03-07 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2018-152 SIP2018-158 SP2018-114 |
研究会情報 |
研究会 |
EA SIP SP |
開催期間 |
2019-03-14 - 2019-03-15 |
開催地(和) |
アイランド ナガサキ(長崎市) |
開催地(英) |
i+Land nagasaki (Nagasaki-shi) |
テーマ(和) |
応用/電気音響,信号処理,音声,一般 |
テーマ(英) |
Engineering/Electro Acoustics, Signal Processing, Speech, and Related Topics |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2019-03-EA-SIP-SP |
本文の言語 |
日本語 |
タイトル(和) |
正則化線形予測に基づく時変複素音声分析を用いたF0推定 |
サブタイトル(和) |
|
タイトル(英) |
F0 estimation using TV-CAR speech analysis based on Regularized LP |
サブタイトル(英) |
|
キーワード(1)(和/英) |
時変複素分析 / Time-Varying Complex AR(TV-CAR) analysis |
キーワード(2)(和/英) |
解析信号 / Analytic signal |
キーワード(3)(和/英) |
l2 ノルム正則化 / l2-norm regularization |
キーワード(4)(和/英) |
音声の F0 推定 / F0 estimation of speech |
キーワード(5)(和/英) |
IRAPT / IRAPT |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
舟木 慶一 / Keiichi Funaki / フナキ ケイイチ |
第1著者 所属(和/英) |
琉球大学 (略称: 琉球大)
Univrsity of the Ryukyus (略称: Univ. of the Ryukyus) |
第2著者 氏名(和/英/ヨミ) |
/ / |
第2著者 所属(和/英) |
(略称: )
(略称: ) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
1 |
発表日時 |
2019-03-15 13:30:00 |
発表時間 |
90 |
申込先研究会 |
SP |
資料番号 |
IEICE-EA2018-152,IEICE-SIP2018-158,IEICE-SP2018-114 |
巻番号(vol) |
IEICE-118 |
号番号(no) |
no.495(EA), no.496(SIP), no.497(SP) |
ページ範囲 |
pp.311-316 |
ページ数 |
IEICE-6 |
発行日 |
IEICE-EA-2019-03-07,IEICE-SIP-2019-03-07,IEICE-SP-2019-03-07 |
|