講演名 2024-02-29
越森 道貴(電通大), 嵯峨山 茂樹(東大/電通大), 中鹿 亘(電通大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) LPCにおける変形相関法の原理を拡張し、短時間音声信号スペクトルから基本周波数と周期性尺度を推定するための手法としてラグ窓、ラグ窓対、複数ラグ窓対などの検討を行う。自己相関関数にラグ窓を弱く掛けて調波構造の谷の凹凸を潰す一方で、ラグ窓を強く掛けて調波構造を潰してスペクトル包絡を得て、両者の比を求めて逆フーリエ変換することで、F0推定精度を向上する方法を検討する。また、推定対象となる音声のF0の分布が未知である場合のため、F0候補の存在する帯域を分割して、複数のラグ窓対を用いるF0推定方法についても述べる。さらに、音声の周期性を数値化する尺度となる周期性尺度の求め方を提案する。音声データベースを用いた評価実験により、提案手法のF0推定性能、周期性尺度による有声無声判定性能の精度評価を行うことで、特にF0の高い音声に対して高い推定精度やノイズに対する頑健性を示し、音声分析の分野における基本手法の一つとなり得る可能性を示した。周期性尺度を用いた有声無声判定は一部条件下において比較手法に匹敵する精度を示し、単一のラグ窓を用いたラグ窓法による有声無声判定は特にF0の高い音声に対して比較手法を上回る精度を示した。
抄録(英) Extending the main concept of modified autocorrelation method in LPC, we investigate lag windows, lag window pairs, and multi-lag window pairs as methods for estimating the fundamental frequency and periodicity measure from short-time speech signal spectra. A lag window is weakly applied to the autocorrelation function to eliminate unevenness in the valleys of the harmonic structure, while a lag window is applied strongly to eliminate the harmonic structure to obtain a spectral envelope, and the ratio of the two is calculated and inverse Fourier transform is performed. We will consider ways to improve the F0 estimation accuracy. In addition, since the distribution of F0 of the speech to be estimated is unknown, we will also describe a F0 estimation method that divides the band in which F0 candidates exist and uses multiple lag window pairs. Furthermore, we propose a method to obtain a periodicity measure, which is a measure for quantifying the periodicity of speech. Through evaluation experiments using a speech database, we evaluated the F0 estimation performance of the proposed method and the voiced/unvoiced decision performance using a periodicity measure. It demonstrated robustness and showed the possibility of becoming one of the basic methods in speech analysis. Voiced/unvoiced judgment using a periodicity measure shows accuracy comparable to the compared methods under some conditions, and voiced/unvoiced decision based on the lag window method using a single lag window is particularly effective for voices with high F0. The accuracy exceeded that of the comparative methods.
キーワード(和) 音声スペクトル包絡 / 基本周波数推定 / 自己相関関数 / ラグ窓 / 周期性尺度 / サイドローブ
キーワード(英) Speech spectral envelope / fundamental frequency estimation / autocorrelation function / lag window / periodicity measure / sidelobes
資料番号 EA2023-75,SIP2023-122,SP2023-57
発行日 2024-02-22 (EA, SIP, SP)

研究会 SIP / SP / EA / IPSJ-SLP
開催期間 2024/2/29(から2日開催)
開催地(和) 沖縄産業支援センター
テーマ(和) 音声,応用/電気音響, 信号処理,一般
委員長氏名(和) 仲地 孝之(琉球大) / 戸田 智基(名大) / 小野 順貴(都立大)
委員長氏名(英) Takayuki Nakachi(Ryukyu Univ.) / Tomoki Toda(Nagoya Univ.) / Junki Ono(Tokyo Metropolitan Univ.)
副委員長氏名(和) 市毛 弘一(横浜国大) / 西川 清史(都立大) / / 西浦 敬信(立命館大) / 梶川 嘉延(関西大)
副委員長氏名(英) Koichi Ichige(Yokohama National Univ.) / Kiyoshi Nishikawa(okyo Metropolitan Univ.) / / Takanobu Nishiura(RitsumeikanUniv.) / Yoshinobu Kajikawa(Kansai Univ.)
幹事氏名(和) 今泉 祥子(千葉大) / 京地 清介(工学院大) / 安藤 厚志(NTT) / 橋本 佳(名工大) / 若山 圭吾(NTT) / 伊藤 信貴(東大)
幹事氏名(英) Shoko Imaizumi(Chiba Univ.) / Seisuke Kyochi(Kogakuin Univ.) / Atsushi Ando(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Keigo Wakayama(NTT) / Nobutaka Ito(Univ. of Tokyo)
幹事補佐氏名(和) 吉田 太一(電通大) / 塩田 さやか(都立大) / 相原 龍(三菱電機) / 齋藤 大輔(東大) / 中山 雅人(阪産大) / 矢田部 浩平(東京農工大)
幹事補佐氏名(英) Taichi Yoshida(UEC) / Sayaka Shiota(Tokyo Metropolitan Univ.) / Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo) / Masato Nakayama(OSU) / Kouhei Yatabe(TUAT)

申込み研究会 Technical Committee on Signal Processing / Technical Committee on Speech / Technical Committee on Engineering Acoustics / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) 複数のラグ窓対を用いた音声基本周波数と周期性尺度の推定
タイトル(英) Multiple Lag Window Pairs for Estimation of Fundamental Frequency and Periodicity Measure of Speech Signals
キーワード(1)(和/英) 音声スペクトル包絡 / Speech spectral envelope
キーワード(2)(和/英) 基本周波数推定 / fundamental frequency estimation
キーワード(3)(和/英) 自己相関関数 / autocorrelation function
キーワード(4)(和/英) ラグ窓 / lag window
キーワード(5)(和/英) 周期性尺度 / periodicity measure
キーワード(6)(和/英) サイドローブ / sidelobes
第 1 著者 氏名(和/英) 越森 道貴 / Michiki Koshimori
第 1 著者 所属(和/英) 電気通信大学(略称:電通大)
University of Electro-Communications(略称:UEC)
第 2 著者 氏名(和/英) 嵯峨山 茂樹 / Shigeki Sagayama
第 2 著者 所属(和/英) 東京大学/電気通信大学(略称:東大/電通大)
The University of Tokyo/University of Electro-Communications(略称:UTokyo/UEC)
第 3 著者 氏名(和/英) 中鹿 亘 / Toru Nakashika
第 3 著者 所属(和/英) 電気通信大学(略称:電通大)
University of Electro-Communications(略称:UEC)
発表年月日 2024-02-29
資料番号 EA2023-75,SIP2023-122,SP2023-57
巻番号(vol) vol.123
号番号(no) EA-401,SIP-402,SP-403
ページ範囲 pp.85-90(EA), pp.85-90(SIP), pp.85-90(SP),
ページ数 6
発行日 2024-02-22 (EA, SIP, SP)