講演抄録/キーワード |
講演名 |
2007-06-28 14:00
サブワードを用いた音声文書検索における複数サブワードの統合 ~ サブワード毎の検索語検索性能期待値の利用 ~ ○伊藤慶明・岩田耕平・小嶋和徳・石亀昌明(岩手県立大)・田中和世(筑波大)・シーウーク リー(産総研) SP2007-10 |
抄録 |
(和) |
大容量のパソコン・ハードディスクレコーダの普及に伴い,音声文書を容易に検索できる機能が求められてる.我々は蓄積された音声文書をどのような言葉でも容易に検索できるようにするため,サブワードモデルを用いた語彙非依存の音声情報検索システムの実現を目指し,既に新しいサブワードモデル,およびそのサブワードモデル間の音響的な距離の提案を行い,比較実験を通してその有効性を確認している.これまでサブワードモデルに,音声認識では一般的なmonophone,triphoneモデルの他,音素を時間軸上で精緻化した1/2音素モデル,1/3音素モデル,Sub-Phonetic Segmentモデルを提案し,個々のモデルの性能比較を行っきた.本稿ではこれらの複数のサブワードによる検索結果の統合方式の検討を行う.検索語によりサブワードモデルの検索性能が異なることから,検索語の検索のしやすさを表す検索性能期待値を統合時に利用する方式を提案する.日本語話し言葉コーパスを用いた音声文書検索実験を通して,複数のサブワードモデルの検索結果の統合,および統合時に検索語の検索性能期待値の導入によって検索性能の向上を確認できた. |
(英) |
According to the spread of personal computers and video hard-disc recorders, a new function to retrieve spoken documents easily is needed. For this purpose of retrieving stored spoken documents by any query words, we have been developing a vocabulary-free spoken document retrieval system based on subword models. We have already proposed new subword models and an acoustic distance between the subword models, and have demonstrated the effectiveness of those approaches in our previous work. For subword models, we introduced not only monophone and triphone models that are general models for speech recognition technology, but also new subword models that are more sophisticated models than triphone models in the time axis, such as a half-phone model, one-third phone model, and Sub-Phonetic Segment (SPS). This paper investigates the method to integrate the results obtained from plural subword models, and proposes an introduction of a retrieval performance expectation for each query word, because the retrieval performance differ from subword models against each query word. Through experiments for spoken document retrieval using Corpus of Spontaneous Japanese, we could confirm the improvement of the retrieval performance by integrating the plural results and introducing the retrieval performance expectation for each query word. |
キーワード |
(和) |
音声文書検索 / サブワード / 複数結果統合 / 検索性能期待値 / / / / |
(英) |
Spoken document retrieval / Subword model / Integration of plural results / Retrieval performance expectation / / / / |
文献情報 |
信学技報, vol. 107, no. 116, SP2007-10, pp. 13-18, 2007年6月. |
資料番号 |
SP2007-10 |
発行日 |
2007-06-21 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2007-10 |
|