講演名 2019-03-15
[ポスター講演]正則化線形予測に基づく時変複素音声分析を用いたF0推定
舟木 慶一(琉球大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声の線形予測 (LP) は音声のスペクトルを 10 数個の AR(自己回帰) 係数で記述できる音声符号化の基本となる方式であり、F0 推定や音声強調のみならず、近年は音声合成にも適用されている。我々は、LP 分析を複素分析と時変分析に拡張した解析信号に対する時変複素音声分析の提案とその音声処理への適用を行っている。すでに、l2 ノルム最適化方式である MMSE 分析や拡大最小 2 乗法 (ELS) などの提案を行っている。一方、l2 ノルム正則化に基づく LP(RLP) 分析も B.Kleijn らにより提案されている。これは F0 が高い場合に第 1 フォルマントが過小推定される推定誤りを減らすために、l2 ノルムにスペクトルの周波数軸上の変動分を表す l2 ノルム正則化項を足し合わせた評価基準を最小化するようにパラメータ推定を行う方式である。また、最近、P.Aklu らにより時間正則化LP(Time-Regilarized LP: TRLP) 分析が提案されている。これは、隣接フレーム間でのパラメータの変動分の l2 ノルムを正則化項とする方式である。本稿では、TV-CAR 分析に RLP を導入した音声分析法を構築し、複素残差を入力とする IRAPT を用いた音声の F0 推定によりその性能評価を行う。
抄録(英) Linear Prediction (LP) analysis is speech analysis to estimate AR(Auto-Regressive) coefficients to represent the all-pole spectrum that is based on speech coding and recently is applied also in speech synthesis. Wehave proposed TV-CAR(Time-Varying Complex AR) speech analysis and have applied it into the speech processingsuch as robust ASR or F0 estimation of speech. We have proposed l2-norm optimization-based TV-CAR speechanalysis for an analytic signal that includes MMSE(Minimizing Mean Square Error) or ELS(Extended Least Square) method. On the other hand, B.Kleijn et al. have proposed a Regularized Linear Prediction (RLP) method. In theRLP, l2 regularized term that means spectral variant in the frequencies to avoid pitch related bias is introduced. The parameter is estimated so as to minimize the l2-norm criterion added by the l2-regularized penalty term. Moreover, P.Alku et al. have proposed Time-Regularized LP (TRLP) analysis. In the TRLP, the regularized term is set as thel2-norm of the difference between the current parameters and previous ones. In this paper, the RLP-based TV-CARspeech analysis is proposed and evaluated with the F0 estimation of speech using IRAPT.
キーワード(和) 時変複素分析 / 解析信号 / l2 ノルム正則化 / 音声の F0 推定 / IRAPT
キーワード(英) Time-Varying Complex AR(TV-CAR) analysis / Analytic signal / l2-norm regularization / F0 estimation of speech / IRAPT
資料番号 EA2018-152,SIP2018-158,SP2018-114
発行日 2019-03-07 (EA, SIP, SP)

研究会情報
研究会 EA / SIP / SP
開催期間 2019/3/14(から2日開催)
開催地(和) アイランド ナガサキ(長崎市)
開催地(英) i+Land nagasaki (Nagasaki-shi)
テーマ(和) 応用/電気音響,信号処理,音声,一般
テーマ(英) Engineering/Electro Acoustics, Signal Processing, Speech, and Related Topics
委員長氏名(和) 島内 末廣(金沢工大) / 村松 正吾(新潟大) / 山下 洋一(立命館大)
委員長氏名(英) Suehiro Shimauchi(Kanazawa Inst. of Tech.) / Shogo Muramatsu(Niigata Univ.) / Yoichi Yamashita(Ritsumeikan Univ.)
副委員長氏名(和) 古家 賢一(大分大) / 渡邉 貫治(秋田県立大) / 相川 直幸(東京理科大) / 林 和則(阪市大) / 李 晃伸(名工大)
副委員長氏名(英) Kenichi Furuya(Oita Univ.) / Kanji Watanabe(Akita Pref. Univ.) / Naoyuki Aikawa(TUS) / Kazunori Hayashi(Osaka City Univ) / Akinobu Ri(Nagoya Inst. of Tech.)
幹事氏名(和) 武岡 成人(静岡理工科大) / 松井 健太郎(NHK) / 渡邊 修(拓殖大) / 中本 昌由(広島大学) / 南條 浩輝(京大) / 坂野 秀樹(名城大)
幹事氏名(英) Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Kentaro Matsui(NHK) / Osamu Watanabe(Takushoku Univ.) / Masayoshi Nakamoto(Hiroshima Univ.) / Hiroaki Nanjo(Kyoto Univ.) / Hideki Banno(Meijo Univ.)
幹事補佐氏名(和) 井本 桂右(立命館大) / 森川 大輔(富山県立大) / 小西 克巳(法政大) / 何 宜欣(拓殖大) / 郡山 知樹(東工大) / 小橋川 哲(NTT)
幹事補佐氏名(英) Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.) / Katsumi Konishi(Hosei Univ.) / hyihsin(Takushoku Univ.) / Tomoki Koriyama(Tokyo Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Technical Committee on Signal Processing / Technical Committee on Speech
本文の言語 JPN
タイトル(和) [ポスター講演]正則化線形予測に基づく時変複素音声分析を用いたF0推定
サブタイトル(和)
タイトル(英) [Poster Presentation] F0 estimation using TV-CAR speech analysis based on Regularized LP
サブタイトル(和)
キーワード(1)(和/英) 時変複素分析 / Time-Varying Complex AR(TV-CAR) analysis
キーワード(2)(和/英) 解析信号 / Analytic signal
キーワード(3)(和/英) l2 ノルム正則化 / l2-norm regularization
キーワード(4)(和/英) 音声の F0 推定 / F0 estimation of speech
キーワード(5)(和/英) IRAPT / IRAPT
第 1 著者 氏名(和/英) 舟木 慶一 / Keiichi Funaki
第 1 著者 所属(和/英) 琉球大学(略称:琉球大)
Univrsity of the Ryukyus(略称:Univ. of the Ryukyus)
発表年月日 2019-03-15
資料番号 EA2018-152,SIP2018-158,SP2018-114
巻番号(vol) vol.118
号番号(no) EA-495,SIP-496,SP-497
ページ範囲 pp.311-316(EA), pp.311-316(SIP), pp.311-316(SP),
ページ数 6
発行日 2019-03-07 (EA, SIP, SP)