講演抄録/キーワード |
講演名 |
2011-12-19 13:50
距離マトリクス画像中からの直線検出によるワードスポッティング(LD-DMI法)を用いた電話会話ログ検索 ○西 宏之・横林優貴・トラン リ ハイエン・木村義政・柿木稔男(崇城大) NLC2011-37 SP2011-82 |
抄録 |
(和) |
電話会話の検索サービスに対するニーズは通信販売やヘルプデスク等を中心に顕在化しているが,電話を多用するオフィス業務においてもキーワード入力による電話会話の検索が可能となれば,生産性向上に貢献できるものと期待される.一方,音声コンテンツを検索する技術は,講演音声やニュース音声などある程度の規則性を想定できる言語モデルを前提とした研究が進んでいるが,一般の電話会話では言語モデルの構築が難しいことから十分な研究が進んでいない.また,検索用エントリーデータはキーボードやタッチパネルから入力されることを前提としており,検索用キーを音声で入力する方式は検討されていない.そこで,本報告では音響モデルのパターンマッチングによるワードスポッティングを対象とし,従来法として連続DPを,提案法として距離マトリクス画像中からの直線検出によるワードスポッティングを新手法として両者の性能を比較する.特に,新手法において距離マトリクス画像の二値化しきい値を,画像の特性に応じて適応的に調整する性能改善案を検討した.適合率90%における再現率と,再現率90%における適合率を用いて評価した結果,提案手法は従来法に比較して概ね5%程度改善できることを明らかにした. |
(英) |
elephone conversation retrieval systems are required for mail order, help desk and similar telecommunications services. The researches of spoken term detection are drove using strong language model. However it is difficult to construct the language model of telephone conversations. On the other hand, key entry method by speech is also required. In order to solve the problems, word spotting can be used. In conventional word spotting, for exsample, continuous dynamic programming(DP) can be appled.
This report proposes a new method in order to realize telephone conversation log retrieval. The method is structured by distance matrix images(DMI) and the line detection in the images. Important parameters are threshold values for binalizing of DMI. The merit of this method is not to need a dictionary and the detailed language model.
This report shows that the evaluation result of the new and the conventional method(continuous DP). |
キーワード |
(和) |
音声認識 / ワードスポッティング / 電話 / 会話ログ / ライフログ / / / |
(英) |
speech recognition / word spotting / telephony / conversation log / life log / / / |
文献情報 |
信学技報, vol. 111, no. 365, SP2011-82, pp. 33-38, 2011年12月. |
資料番号 |
SP2011-82 |
発行日 |
2011-12-12 (NLC, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2011-37 SP2011-82 |