電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2011-09-22 13:40
孤立単語音声認識を用いた雑音ロバストキーワードスポッティング
高橋 亘宮永喜一北大
抄録 (和) 本研究では,雑音環境下での連続音声からキーワードスポッティングを行った.
提案手法は雑音ロバスト孤立単語音声認識を連続音声に適用することでキーワー
ドを抽出する.この手法ではハードウェアの構成法である超並列処理を用いるこ
とで実時間での処理を目指している.本研究ではこの手法を超並列音声認識と呼
ぶ.連続音声を複数の区間に分割し,それぞれの区間に単語音声認識を処理する
ことでキーワードの区間を推定することができる.また,キーワードスポッティ
ングを行う際,キーワード以外の音声や非音声を認識結果としては認識精度が下
がる.よって,それらの結果を棄却する処理が必要となる.棄却処理には認識処
理で得られる尤度を用いて棄却するかを判定する.超並列音声認識を行うことで
複数の認識結果が得られるため,これらの情報を総合しすることで棄却処理の信
頼性を向上させることができる.超並列音声認識によるキーワードスポッティン
グを行った結果,雑音環境下でも高い認識率を得ることができた. 
(英) In this report, we performed a keyword spotting from cotinuous speech under noisy environments. The proposed algorithm is based on the robust isolated word recognition and it is applied for the continuous speech. Super parallel calculation mechanism is embedded into the proposed method. We can realize real time processing using its parallel structure in a hardware system.
This paper calls super-parallel automatic speech recognition (SP-ASR).
The method can estimate the section of the keywords and recognize it from continuous speech. If a speech except the keywords and non-speech are given during this recognition, the recognition accuracy is degraded.
Therefore, the new processing which rejects the unsuitable results is necessary.By using the likelihoods into speech recognition, the new rejection algorism is
implemented.
Some recognition results are computed by SP-ASR and the reliability of the recognition and the rejection can be improved.
We finally show a result that high recognition ratio could be obtained by
performing keyword spotting in SP-ASR from continuous speech under noisy environments.
キーワード (和) キーワードスポッティング / 音声認識 / 雑音ロバスト / 棄却 / / / /  
(英) keyword spotting / speech recognition / noise robust / rejection / / / /  
文献情報 信学技報, vol. 111, no. 210, SIS2011-37, pp. 105-109, 2011年9月.
資料番号 SIS2011-37 
発行日 2011-09-14 (SIS) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 SIS IPSJ-AVM  
開催期間 2011-09-21 - 2011-09-22 
開催地(和) 秋田大学手形キャンパスベンチャービジネスラボラトリー 大セミナー室 
開催地(英)  
テーマ(和) 知的マルチメディアシステム,一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SIS 
会議コード 2011-09-SIS-AVM 
本文の言語 日本語 
タイトル(和) 孤立単語音声認識を用いた雑音ロバストキーワードスポッティング 
サブタイトル(和)  
タイトル(英) Robust Keyword Spotting using The Isolated Word Recognition 
サブタイトル(英)  
キーワード(1)(和/英) キーワードスポッティング / keyword spotting  
キーワード(2)(和/英) 音声認識 / speech recognition  
キーワード(3)(和/英) 雑音ロバスト / noise robust  
キーワード(4)(和/英) 棄却 / rejection  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 高橋 亘 / Wataru Takahashi / タカハシ ワタル
第1著者 所属(和/英) 北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.)
第2著者 氏名(和/英/ヨミ) 宮永 喜一 / Yoshikazu Miyanaga /
第2著者 所属(和/英) 北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2011-09-22 13:40:00 
発表時間 25 
申込先研究会 SIS 
資料番号 IEICE-SIS2011-37 
巻番号(vol) IEICE-111 
号番号(no) no.210 
ページ範囲 pp.105-109 
ページ数 IEICE-5 
発行日 IEICE-SIS-2011-09-14 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会