講演名 | 1998/3/5 ディジタル蝸牛モデルとHMMを用いた話者識別 佐藤 康一朗, Michael Inman, 半谷 精一郎, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 単語音声を利用した話者識別では経時変化により識別率が低下する。この要因として、発声時間の変化や、各発声における音素の時間長の変化が考えられる。本報告では、ディジタル蝸牛モデルから得られた特徴パラメータを、HMM(Hidden Markov Model)を利用して発声時間の正規化を行なうことで経時変化の吸収を試みた。18人の話者識別実験の結果、平均識別率は、ディジタル蝸牛モデルのみで75.67%だったものが、ディジタル蝸牛モデル出力をHMMによって正規化することによって83.47%と、7.80%の改善ができた。さらに、各音素の位置を利用して、より個人差の大きい音素に重み付けをし、ディジタル蝸牛モデルからの出力を段方向に差分をとった話者識別も試みた。これらの対策を加えることで87.78%とさらに4.31%の改善ができることが明らかになった。 |
抄録(英) | In this study, we show that the use of hidden Markov models(HMMs)significantly enhances the success rate of speaker identification over time.The segment boundary information derived from HMMs provides a means of normalizing the formant patterns obtained from a digital cochlear filter, which we also describe.The use of the digital cochlear filter and HMMs in our study was motivated by two well-known problems in speech recognition generally, i.e., phonetic tempo variability and variability over temporal units of a given length, typically days.We show how these problems can be minimized to achieve more robust speaker identification. |
キーワード(和) | 聴覚系 / ディジタル蝸牛モデル / 話者識別 / HMM |
キーワード(英) | auditory system / digital cochlear model / speaker identification / HMM |
資料番号 | |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 1998/3/5(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | JPN |
タイトル(和) | ディジタル蝸牛モデルとHMMを用いた話者識別 |
サブタイトル(和) | |
タイトル(英) | Speaker Identification Using Digital Cochlear Model And Hidden Markov Model |
サブタイトル(和) | |
キーワード(1)(和/英) | 聴覚系 / auditory system |
キーワード(2)(和/英) | ディジタル蝸牛モデル / digital cochlear model |
キーワード(3)(和/英) | 話者識別 / speaker identification |
キーワード(4)(和/英) | HMM / HMM |
第 1 著者 氏名(和/英) | 佐藤 康一朗 / Koichiro SATO |
第 1 著者 所属(和/英) | 東京理科大学工学部電気工学科 Department of Electrical Engineering, Science University of Tkyo |
第 2 著者 氏名(和/英) | Michael Inman / Inman Michael |
第 2 著者 所属(和/英) | CSLI Stanford University CSLI Stanford University |
第 3 著者 氏名(和/英) | 半谷 精一郎 / Seiichiro HANGAI |
第 3 著者 所属(和/英) | 東京理科大学工学部電気工学科 Department of Electrical Engineering, Science University of Tkyo |
発表年月日 | 1998/3/5 |
資料番号 | |
巻番号(vol) | vol.97 |
号番号(no) | 586 |
ページ範囲 | pp.- |
ページ数 | 7 |
発行日 |