大会名称 |
---|
2010年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2010 |
発行日 |
2010/8/20 |
セッション番号 |
5A |
セッション名 |
アルゴリズム・コンピュテーション(2) |
講演日 |
2010/09/08 |
講演場所(会議室等) |
A会場(総合学習プラザ1F 第5講義室) |
講演番号 |
A-022 |
タイトル |
圧縮された接尾辞配列を用いた近似文字列照合 |
著者名 |
田中 洋輔, 小野 廣隆, 定兼 邦彦, 山下 雅史, |
キーワード |
近似文字列照合, 接尾辞配列, 圧縮索引 |
抄録 |
あるパターンそれ自身だけでなく, それに類似したものも同時に検索するという 近似文字列照合 (Approximate String Matching) は, テキスト検索, 計算生物学, パターン認識等に応用を持つ, 重要な機能である. 近似文字列照合を解く様々な手法が提案されており, その中で, 全文検索を実現する索引である接尾辞配列 (SA) を用いた手法が知られているが, 本論文では, そのSAの代用として, SAを複数のブロックに分割し, そのブロックの中で昇順にソートを行い, その差分をとることで圧縮を行ったものを用いる. |
本文pdf |
PDF download (148KB) |