お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2012-12-13 14:45
雑音環境下における破裂音に対するロバスト音声認識
橋本祐介高橋 亘宮永喜一北大SIS2012-37
抄録 (和) 本論文は,破裂音に対してロバストな音声認識手法を提案する.
破裂音の特徴は,クリーン音声においても表れにくく,雑音音声では雑音の影響を受け波形が歪むため,さらに検出が難しい.
それ故に,破裂音を含む単語の認識は困難である.
本手法では,初めに破裂音の音声区間を検出し,次に破裂音の特徴を捉えるため,フレーム幅を短くして特徴量を計算し,HMMによる単語認識を行う.
結果,雑音環境下において,認識率を7$\%$改善した.
また,バブルノイズを含む音声に対しては認識率を約15$\%$改善した. 
(英) In this papar, we propose robust speech recognition for plosive sounds under noisy environment.
The proposed method employs a simple algorithm and causes a good effect for the improvement of recognition rate among plosive sounds.
The proposed method first detects all small parts including plosive sounds automatically and recognizes them by using a short time frame speech features.
As a result, the proposed method improves the recognition rate 7$\%$ under noisy speech.
In addition, the recognition rate is improved about 15$\%$ for sounds added with babble noise.
These experiments indicate that the proposed method is effective for speech under noisy environments.
キーワード (和) 音声認識 / 単語認識 / 破裂音 / 隠れマルコフモデル / 音声区間検出 / / /  
(英) Speech Recognition / Word Recognition / Plosive Sound / Hidden Markov Model / Voice Activity Detection / / /  
文献情報 信学技報, vol. 112, no. 348, SIS2012-37, pp. 39-43, 2012年12月.
資料番号 SIS2012-37 
発行日 2012-12-06 (SIS) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SIS2012-37

研究会情報
研究会 SIS  
開催期間 2012-12-13 - 2012-12-14 
開催地(和) 日大津田沼キャンパス 
開催地(英) Nihon University Tsudanuma Campus 
テーマ(和) システムオンシリコン,RFID関連技術,一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SIS 
会議コード 2012-12-SIS 
本文の言語 日本語 
タイトル(和) 雑音環境下における破裂音に対するロバスト音声認識 
サブタイトル(和)  
タイトル(英) Robust Speech Recognition for Plosive Sound under Noisy Environment 
サブタイトル(英)  
キーワード(1)(和/英) 音声認識 / Speech Recognition  
キーワード(2)(和/英) 単語認識 / Word Recognition  
キーワード(3)(和/英) 破裂音 / Plosive Sound  
キーワード(4)(和/英) 隠れマルコフモデル / Hidden Markov Model  
キーワード(5)(和/英) 音声区間検出 / Voice Activity Detection  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 橋本 祐介 / Yusuke Hashimoto / ハシモト ユウスケ
第1著者 所属(和/英) 北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.)
第2著者 氏名(和/英/ヨミ) 高橋 亘 / Wataru Takahashi / タカハシ ワタル
第2著者 所属(和/英) 北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.)
第3著者 氏名(和/英/ヨミ) 宮永 喜一 / Yoshikazu Miyanaga / ミヤナガ ヨシカズ
第3著者 所属(和/英) 北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2012-12-13 14:45:00 
発表時間 20分 
申込先研究会 SIS 
資料番号 SIS2012-37 
巻番号(vol) vol.112 
号番号(no) no.348 
ページ範囲 pp.39-43 
ページ数
発行日 2012-12-06 (SIS) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会