3つの異なる種類の音声認識器を利用した照応解析

嶋田,和孝; 棚町,範子; 遠藤,勉

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2010-07-23 15:00 3つの異なる種類の音声認識器を利用した照応解析 ○嶋田和孝・棚町範子・遠藤　勉（九工大） NLC2010-8
抄録	（和）	本論文では，複数の異なる認識器を組み合わせた音声理解手法に基づく照応解析について述べる．提案手法は，(1)1つの大語彙認識器と(2)複数の小語彙なドメイン依存認識器，(3)中規模なドメイン依存認識器の3種類で構成される．提案手法では，介護支援ロボットをタスクとし，小語彙認識器で，ロボットへの命令発話についてロバストな認識を実現し，一方で，大語彙認識器により，命令発話以外の雑談中に存在する単語やトピックを獲得する．ユーザからの命令発話中に，照応詞が存在する場合は，それ以前のそれぞれの音声認識器の結果から適切な先行詞を推定する．先行詞は，大語彙認識器が扱う発話中に存在することが多いが，大語彙認識器の認識精度は十分ではない．そこで，提案手法中の小語彙認識器の語彙を組み合わせた中規模な認識器を用意し，大語彙認識器の認識精度の問題を解消する．実験により，中規模認識器を含む手法の有効性が確認された．
	（英）	In this paper, we propose a combination method of 3 different types of speech recognizers. The method consists of a large vocabulary continuous speech recognizer (LVCSR) and 2 types of domain-specific speech recognizers (DSSR). By integrating them, we can realize a simple and flexible speech understanding method with an anaphora resolution process. The DSSRs consists of some DSSRs with a small vocabulary for particular topics in a target task and a DSSR with a medium-scale vocabulary for the task. The task of this system is speech understanding for a livelihood support robot. First we describe the basic idea of our multiple speech recognizer. The selection process in the recognizer is based on the similarity between the LVCSR and each DSSR. Then we explain an anaphora resolution method in the recognizer. By using the outputs from the LVCSR and the medium-scale DSSR, we resolve anaphoric expressions in the current outputs from small-scale DSSRs. The experimental results show the effectiveness of the proposed method.
キーワード	（和）	照応解析 / 複合音声認識器 / 統合 / / / / /
	（英）	naphora resolution / Multiple speech recognizer / Combination / / / / /
文献情報		信学技報, vol. 110, no. 142, NLC2010-8, pp. 69-74, 2010年7月.
資料番号		NLC2010-8
発行日		2010-07-15 (NLC)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		NLC2010-8

研究会情報
研究会	NLC IPSJ-NL
開催期間	2010-07-22 - 2010-07-23
開催地（和）	東北大学青葉山キャンパス
開催地（英）	Tohoku Univeristy
テーマ（和）	一般
テーマ（英）
講演論文情報の詳細
申込み研究会	NLC
会議コード	2010-07-NLC-NL
本文の言語	日本語
タイトル（和）	3つの異なる種類の音声認識器を利用した照応解析
サブタイトル（和）
タイトル（英）	Combination of 3 types of speech recognizers for anaphora resolution
サブタイトル（英）
キーワード(1)（和/英）	照応解析 / naphora resolution
キーワード(2)（和/英）	複合音声認識器 / Multiple speech recognizer
キーワード(3)（和/英）	統合 / Combination
キーワード(4)（和/英）	/
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	嶋田和孝 / Kazutaka Shimada / シマダカズタカ
第1著者所属（和/英）	九州工業大学 (略称：九工大) Kyushu Institute of Technology (略称： Kyushu Inst. of Tech.)
第2著者氏名（和/英/ヨミ）	棚町範子 / Noriko Tanamachi / タナマチノリコ
第2著者所属（和/英）	九州工業大学 (略称：九工大) Kyushu Institute of Technology (略称： Kyushu Inst. of Tech.)
第3著者氏名（和/英/ヨミ）	遠藤勉 / Tsutomu Endo / エンドウツトム
第3著者所属（和/英）	九州工業大学 (略称：九工大) Kyushu Institute of Technology (略称： Kyushu Inst. of Tech.)
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2010-07-23 15:00:00
発表時間	30分
申込先研究会	NLC
資料番号	NLC2010-8
巻番号（vol）	vol.110
号番号（no）	no.142
ページ範囲	pp.69-74
ページ数	6
発行日	2010-07-15 (NLC)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会