講演名 | 2012-12-13 雑音環境下における破裂音に対するロバスト音声認識 橋本 祐介, 高橋 亘, 宮永 喜一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本論文は,破裂音に対してロバストな音声認識手法を提案する.破裂音の特徴は,クリーン音声においても表れにくく,雑音音声では雑音の影響を受け波形が歪むため,さらに検出が難しい.それ故に,破裂音を含む単語の認識は困難である.本手法では,初めに破裂音の音声区間を検出し,次に破裂音の特徴を捉えるため,フレーム幅を短くして特徴量を計算し,HMMによる単語認識を行う.結果,雑音環境下において,認識率を7%改善した.また,バブルノイズを含む音声に対しては認識率を約15%改善した. |
抄録(英) | In this papar, we propose robust speech recognition for plosive sounds under noisy environment.The proposed method employs a simple algorithm and causes a good effect for the improvement of recognition rate among plosive sounds.The proposed method first detects all small parts including plosive sounds automatically and recognizes them by using a short time frame speech features.As a result, the proposed method improves the recognition rate 7% under noisy speech.In addition, the recognition rate is improved about 15% for sounds added with babble noise.These experiments indicate that the proposed method is effective for speech under noisy environments. |
キーワード(和) | 音声認識 / 単語認識 / 破裂音 / 隠れマルコフモデル / 音声区間検出 |
キーワード(英) | Speech Recognition / Word Recognition / Plosive Sound / Hidden Markov Model / Voice Activity Detection |
資料番号 | SIS2012-37 |
発行日 |
研究会情報 | |
研究会 | SIS |
---|---|
開催期間 | 2012/12/6(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Smart Info-Media Systems (SIS) |
---|---|
本文の言語 | JPN |
タイトル(和) | 雑音環境下における破裂音に対するロバスト音声認識 |
サブタイトル(和) | |
タイトル(英) | Robust Speech Recognition for Plosive Sound under Noisy Environment |
サブタイトル(和) | |
キーワード(1)(和/英) | 音声認識 / Speech Recognition |
キーワード(2)(和/英) | 単語認識 / Word Recognition |
キーワード(3)(和/英) | 破裂音 / Plosive Sound |
キーワード(4)(和/英) | 隠れマルコフモデル / Hidden Markov Model |
キーワード(5)(和/英) | 音声区間検出 / Voice Activity Detection |
第 1 著者 氏名(和/英) | 橋本 祐介 / Yusuke HASHIMOTO |
第 1 著者 所属(和/英) | 北海道大学大学院情報科学研究科 Graduate School of Information Science and Technology Hokkaido University |
第 2 著者 氏名(和/英) | 高橋 亘 / Wataru TAKAHASHI |
第 2 著者 所属(和/英) | 北海道大学大学院情報科学研究科 Graduate School of Information Science and Technology Hokkaido University |
第 3 著者 氏名(和/英) | 宮永 喜一 / Yoshikazu MIYANAGA |
第 3 著者 所属(和/英) | 北海道大学大学院情報科学研究科 Graduate School of Information Science and Technology Hokkaido University |
発表年月日 | 2012-12-13 |
資料番号 | SIS2012-37 |
巻番号(vol) | vol.112 |
号番号(no) | 348 |
ページ範囲 | pp.- |
ページ数 | 5 |
発行日 |