講演名 | 2002/12/12 モーラ情報を用いた単語音声認識の検討 妹尾 貴宏, 村上 仁一, 池原 悟, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 現在,単語音声認識では特徴パラメータとしてケプストラムが使用されている.ケプストラムは,低次にフォルマント情報を,高次にピッチ情報を,それぞれ含んでいる.従来の音声認識では,入力パラメータとして,フォルマント情報が使用されている.ピッチ情報は,ピッチ周波数を安定して抽出するのが困難なため,通常使用されない.しかし,最近の研究でピッチ周波数とモーラ情報には依存関係があることが知られている.本研究では,ピッチ情報の代わりにモーラ情報を使用することによりフォルマントにおけるピッチの影響を分離できると仮定し,モーラ情報を使用して単語音声認識を行った.その結果,多くの話者に対し認識率が向上した.また,モーラ情報を使用した認識結果は,語頭語尾を考慮したモデルやTriphoneモデルの認識結果よりも高い,という結果が得られた.その結果,モーラ情報の有効性が認められた. |
抄録(英) | Recently, in word speech recognition, cepstram is normally used as parameters. And, pitch information is not normally used because it is difficult to extract pitch frequency steady. However, in recent reserches, it is known that there is a relation between pitch frequency and mora information. Then in this paper, we performed word speech recognition using mora information in stead of pitch and examined its validity. In the results, by using mora information, error rate of word speech recognition could decrease for many speeker. And comparing the results of word speech recognition using mora information with using begining and ending of a word or using triphone, the recognition rate using mora information was higher. And the efficiency of this way was confirmed. |
キーワード(和) | 単語音声認識 / モーラ数 / モーラ位置 / 語頭語尾 / Triphone |
キーワード(英) | Word speech recognition / Mora length / Mora position / Begining and ending of a word / Triphone |
資料番号 | NLC2002-53 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2002/12/12(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | モーラ情報を用いた単語音声認識の検討 |
サブタイトル(和) | |
タイトル(英) | |
サブタイトル(和) | |
キーワード(1)(和/英) | 単語音声認識 / Word speech recognition |
キーワード(2)(和/英) | モーラ数 / Mora length |
キーワード(3)(和/英) | モーラ位置 / Mora position |
キーワード(4)(和/英) | 語頭語尾 / Begining and ending of a word |
キーワード(5)(和/英) | Triphone / Triphone |
第 1 著者 氏名(和/英) | 妹尾 貴宏 / Takahiro SEO |
第 1 著者 所属(和/英) | 鳥取大学工学部 Faculty of Engineering, Tottori university |
第 2 著者 氏名(和/英) | 村上 仁一 / Jin'ichi MURAKAMI |
第 2 著者 所属(和/英) | 鳥取大学工学部 Faculty of Engineering, Tottori university |
第 3 著者 氏名(和/英) | 池原 悟 / Satoru IKEHARA |
第 3 著者 所属(和/英) | 鳥取大学工学部 Faculty of Engineering, Tottori university |
発表年月日 | 2002/12/12 |
資料番号 | NLC2002-53 |
巻番号(vol) | vol.102 |
号番号(no) | 527 |
ページ範囲 | pp.- |
ページ数 | 7 |
発行日 |