講演名 1998/9/11
HMMに基づいた極低ビットレート音声符号化
広井 順, 徳田 恵一, 益子 貴史, 小林 隆夫, 北村 正,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本文ではHMM(Hidden Markov Model)に基づく極低ビットレート音声符号化について述べている.符号化器側では, HMMにより音素認識を行ない, 復号化器に音素インデックス列, 状態継続長, ピッチ情報を伝送する.復号化器側では, 音素インデックス列に従い音素HMMを連結する.そして, 連結したHMMから, 状態継続長に従って, ML基準による音声パラメータ生成アルゴリズムにより, メルケプストラム列を生成する.最後に, 生成されたメルケプストラムを係数としてもつMLSA(Mel Log Spectrum Approximation)フィルタを, ピッチ情報に従って励振することによって合成音声を得る.主観評価実験の結果, ピッチ情報を除いて約150bit/s(26%の無音区間を含む)の提案方式により, 同じくピッチ情報を除いて400bit/s(8bit/frame×50frame/s)のベクトル量子化に基づくボコーダと同等の性能を得ることができた.
抄録(英) This paper presents a very low bit rate speech coder based on HMM(Hidden Markov Model). The encoder is equivalent to a phoneme recognizer, and transmits phoneme indexes, state durations, and pitch information to the decoder. In the decoder, phoneme HMMs are concatenated according to the phoneme indexes, and a sequence of mel-cepstral coefficient vectors is generated from the concatenated HMM by using an ML-based speech parameter generation technique. Finally we obtain synthetic speech by exciting the MLSA(Mel Log Spectrum Approximation) filter, whose coefficients are given by mel-cepstral coefficients, according to the pitch information. A subjective listening test shows that the performance of the proposed coder at about 150 bit/s(for the test data including 26 % silence region)is comparable to a VQ-based vocoder at 400 bit/s(=8 bit/frame × 50 frame/s)without pitch quantization for both coders.
キーワード(和) 隠れマルコフモデル / MLSAフィルタ / 音声符号化 / 極低ビットレート
キーワード(英) hidden Markov model / MLSA filter / speech coding / very low bit rate
資料番号 DSP98-84,SP98-63
発行日

研究会情報
研究会 SP
開催期間 1998/9/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) HMMに基づいた極低ビットレート音声符号化
サブタイトル(和)
タイトル(英) VERY LOW BIT RATE SPEECH CODING BASED ON HMMS
サブタイトル(和)
キーワード(1)(和/英) 隠れマルコフモデル / hidden Markov model
キーワード(2)(和/英) MLSAフィルタ / MLSA filter
キーワード(3)(和/英) 音声符号化 / speech coding
キーワード(4)(和/英) 極低ビットレート / very low bit rate
第 1 著者 氏名(和/英) 広井 順 / Jun Hiroi
第 1 著者 所属(和/英) 名古屋工業大学知能情報システム学科
Department of Computer Science, Nagoya Inst.of Tech.
第 2 著者 氏名(和/英) 徳田 恵一 / Keiichi Tokuda
第 2 著者 所属(和/英) 名古屋工業大学知能情報システム学科
Department of Computer Science, Nagoya Inst.of Tech.
第 3 著者 氏名(和/英) 益子 貴史 / Takashi Masuko
第 3 著者 所属(和/英) 東京工業大学精密工学研究所
Precision and Intelligence Lab., Tokyo Inst.of Tech.
第 4 著者 氏名(和/英) 小林 隆夫 / Takao Kobayashi
第 4 著者 所属(和/英) 東京工業大学大学院総合理工学研究科
Interdisciplinary Graduate School of Science and Engineering, Tokyo Inst.of Tech.
第 5 著者 氏名(和/英) 北村 正 / Tadashi Kitamura
第 5 著者 所属(和/英) 名古屋工業大学知能情報システム学科
Department of Computer Science, Nagoya Inst.of Tech.
発表年月日 1998/9/11
資料番号 DSP98-84,SP98-63
巻番号(vol) vol.98
号番号(no) 264
ページ範囲 pp.-
ページ数 6
発行日