講演抄録/キーワード |
講演名 |
2011-11-14 13:10
電話会話ログ検索における再現率と適合率による評価法の検討 ○西 宏之・横林優貴・トラン リ ハイエン・木村義政・柿木稔男(崇城大) ISEC2011-39 LOIS2011-33 |
抄録 |
(和) |
電話会話の検索サービスに対するニーズは通信販売やヘルプデスク等を中心に顕在化している.音声による検索技術は講演音声やニュース音声などある程度の規則性を想定できる言語モデルを前提とした研究が進んでいるが,一般の電話会話では言語モデルの構築が難しいことから研究が進んでいない.そこで,本報告では音響モデルと単語辞書のみによるワードスポッティングを対象とし,従来法として連続DPを,提案法として距離マトリクス画像中からの直線検出によるワードスポッティングを新手法として両者の評価法を検討し,提案手法の有効性を明らかにする.新手法のパラメータとして距離マトリクス画像の二値化しきい値,直線の幅,二値化画像の白ピクセルの割合を変化させ,評価法としては,一定の適合率を前提とした場合の再現率と,一定の再現率を満たす適合率を用い,従来法に対する提案法の優位性を実験結果により明らかにする. |
(英) |
Telephone conversation retrieval systems are required for mail order, help desk and similar telecommunications services. The researches of spoken term detection are drove using strong language model. However it is difficult to construct the language model of telephone conversations. In such case, word spotting can be used. In conventional word spotting, for exsample, continuous dynamic programming(DP) can be appled.
This report proposes a new method in order to realize telephone conversation log retrieval. The method is structured by distance matrix images(DMI) and the Hough transform of DMI. Important parameters are threshold values for binalizing of DMI and voting of Hough transfom. The merit of this method is not to need a dictionary and the detailed language model.
This report shows that the evaluation method and the result that indicates the advatages of the new method compared with the conventional method, the continuous DP. |
キーワード |
(和) |
ライフログ / 電話 / 会話ログ / 音声認識 / ワードスポッティング / / / |
(英) |
life log / telephony / conversation log / speech recognition / word spotting / / / |
文献情報 |
信学技報, vol. 111, no. 286, LOIS2011-33, pp. 33-38, 2011年11月. |
資料番号 |
LOIS2011-33 |
発行日 |
2011-11-07 (ISEC, LOIS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ISEC2011-39 LOIS2011-33 |