電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2019-03-15 13:30
[ポスター講演]言語モデルに基づく音素セット縮小
古明地秀治田中聡久東京農工大
技報オンラインサービス実施中
抄録 (和) 言語モデルに基づく音素セット縮小方法を提案する.音素セットの縮小は,学習データが少なく全音素の学習が難しいタスクにおいて音素識別性能を向上させる一方,同音単語を増加させ,音声認識の精度劣化を誘発する弊害を併せもつ.提案する音素セット縮小方法では,言語モデルにおけるN-gram の出現確率から算出した「発音/単語列混同率」に基づき,音声認識の精度劣化を抑えながら音素数を減らす事を可能にする.提案法で得られた縮小音素セットを日本語大語彙音声認識システムに適用したところ,単語誤り率が全39 音素で14.6% のところ,10 音素に減らしても17.7% と,精度劣化を3% 程度にとどめることができた. 
(英) A design of reduced phoneme set based on a language model is proposed. The reduction of the phoneme set improves discriminability of phonemes under the condition where the amount of training data is too small to train each phoneme model. On the other hand, it increases homophones that yield degradation of speech recognition. In the proposed approach, it is possible to reduce phonemes preventing degradation, regarding pronunciation/word sequence confusion rate calculated from N-grams in a language model. In an experiment, the phoneme set designed with proposed approach was applied to Japanese large vocabulary speech recognition system. The word error rate with the 10 phonemes set was 14.6%, while the error rate with full 39 phonemes set was 17.7%. The degradation was able to be suppressed in about 3%.
キーワード (和) 音声認識 / 脳波デコーディング / 音素セット / 言語モデル / N-gram / / /  
(英) Automatic speech recognition / Brain machine interface / Phoneme set / Language model / N-gram / / /  
文献情報 信学技報, vol. 118, no. 496, SIP2018-140, pp. 205-210, 2019年3月.
資料番号 SIP2018-140 
発行日 2019-03-07 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 EA SIP SP  
開催期間 2019-03-14 - 2019-03-15 
開催地(和) アイランド ナガサキ(長崎市) 
開催地(英) i+Land nagasaki (Nagasaki-shi) 
テーマ(和) 応用/電気音響,信号処理,音声,一般 
テーマ(英) Engineering/Electro Acoustics, Signal Processing, Speech, and Related Topics 
講演論文情報の詳細
申込み研究会 SIP 
会議コード 2019-03-EA-SIP-SP 
本文の言語 日本語 
タイトル(和) 言語モデルに基づく音素セット縮小 
サブタイトル(和)  
タイトル(英) A Design of Reduced Phoneme Set Based on a Language Model 
サブタイトル(英)  
キーワード(1)(和/英) 音声認識 / Automatic speech recognition  
キーワード(2)(和/英) 脳波デコーディング / Brain machine interface  
キーワード(3)(和/英) 音素セット / Phoneme set  
キーワード(4)(和/英) 言語モデル / Language model  
キーワード(5)(和/英) N-gram / N-gram  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 古明地 秀治 / Shuji Komeiji / コメイジ シュウジ
第1著者 所属(和/英) 東京農工大学 (略称: 東京農工大)
Tokyo University of Agriculture and Technology (略称: Tokyo Univ. of Agriculture and Tech.)
第2著者 氏名(和/英/ヨミ) 田中 聡久 / Toshihisa Tanaka / タナカ トシヒサ
第2著者 所属(和/英) 東京農工大学 (略称: 東京農工大)
Tokyo University of Agriculture and Technology (略称: Tokyo Univ. of Agriculture and Tech.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2019-03-15 13:30:00 
発表時間 90 
申込先研究会 SIP 
資料番号 IEICE-EA2018-134,IEICE-SIP2018-140,IEICE-SP2018-96 
巻番号(vol) IEICE-118 
号番号(no) no.495(EA), no.496(SIP), no.497(SP) 
ページ範囲 pp.205-210 
ページ数 IEICE-6 
発行日 IEICE-EA-2019-03-07,IEICE-SIP-2019-03-07,IEICE-SP-2019-03-07 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会