講演抄録/キーワード |
講演名 |
2010-07-23 15:00
3つの異なる種類の音声認識器を利用した照応解析 ○嶋田和孝・棚町範子・遠藤 勉(九工大) NLC2010-8 |
抄録 |
(和) |
本論文では,複数の異なる認識器を組み合わせた音声理解手法に基づく照応解析について述べる.提案手法は,(1)1つの大語彙認識器と(2)複数の小語彙なドメイン依存認識器,(3)中規模なドメイン依存認識器の3種類で構成される.提案手法では,介護支援ロボットをタスクとし,小語彙認識器で,ロボットへの命令発話についてロバストな認識を実現し,一方で,大語彙認識器により,命令発話以外の雑談中に存在する単語やトピックを獲得する.
ユーザからの命令発話中に,照応詞が存在する場合は,それ以前のそれぞれの音声認識器の結果から適切な先行詞を推定する.先行詞は,大語彙認識器が扱う発話中に存在することが多いが,大語彙認識器の認識精度は十分ではない.そこで,提案手法中の小語彙認識器の語彙を組み合わせた中規模な認識器を用意し,大語彙認識器の認識精度の問題を解消する.実験により,中規模認識器を含む手法の有効性が確認された. |
(英) |
In this paper, we propose a combination method of 3 different types of speech recognizers. The method consists of a large vocabulary continuous speech recognizer (LVCSR) and 2 types of domain-specific speech recognizers (DSSR). By integrating them, we can realize a simple and flexible speech understanding method with an anaphora resolution process. The DSSRs consists of some DSSRs with a small vocabulary for particular topics in a target task and a DSSR with a medium-scale vocabulary for the task. The task of this system is speech understanding for a livelihood support robot.
First we describe the basic idea of our multiple speech recognizer. The selection process in the recognizer is based on the similarity between the LVCSR and each DSSR. Then we explain an anaphora resolution method in the recognizer. By using the outputs from the LVCSR and the medium-scale DSSR, we resolve anaphoric expressions in the current outputs from small-scale DSSRs. The experimental results show the effectiveness of the proposed method. |
キーワード |
(和) |
照応解析 / 複合音声認識器 / 統合 / / / / / |
(英) |
naphora resolution / Multiple speech recognizer / Combination / / / / / |
文献情報 |
信学技報, vol. 110, no. 142, NLC2010-8, pp. 69-74, 2010年7月. |
資料番号 |
NLC2010-8 |
発行日 |
2010-07-15 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2010-8 |