講演名 2021-12-27
転置インデクスを用いた動的なテキスト集合に対する類似検索の高速化
土田 祐将(電通大), 古賀 久志(電通大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では SNS から投稿内容が似た類似ユーザを見つける状況を想定し,ユーザをテキストストリームでモデル化し動的に変化するテキスト集合を対象とする類似検索を取り扱う.とくにこの問題に対する既存アルゴリズムを転置インデクスを使って高速化することを目指す.転置インデクスはテキスト検索における標準的な要素技術である.しかし,テキスト集合が動的に変化する場合,転置インデクスを更新するオーバーヘッドが生じるため,その適用は自明ではない.本研究では転置インデクスを使用するか否かをアルゴリズム内のテキスト照合パターンに応じて選択することにより,既存アルゴリズムを高速化できることを示す.
抄録(英)
キーワード(和) 類似検索 / テキストストリーム / 転置インデクス / 枝刈りアルゴリズム
キーワード(英)
資料番号 DE2021-15
発行日 2021-12-20 (DE)

研究会情報
研究会 DE / IPSJ-DBS
開催期間 2021/12/27(から1日開催)
開催地(和) 国立情報学研究所(NII)
開催地(英)
テーマ(和) データ工学・データベースシステムとエンターテイメントおよび一般
テーマ(英)
委員長氏名(和) 吉田 尚史(駒澤大)
委員長氏名(英) Naofumi Yoshida(Komazawa Univ.)
副委員長氏名(和) 的野 晃整(産総研) / 鈴木 優(岐阜大)
副委員長氏名(英) Akiyoshi Matono(AIST) / Yu Suzuki(Gifu Univ.)
幹事氏名(和) 鷹野 孝典(神奈川工科大) / 新妻 弘崇(阪大)
幹事氏名(英) Kosuke Takano(Kanagawa Inst. of Tech.) / Hirotaka Niitsuma(Osaka Univ.)
幹事補佐氏名(和) 本多 賢(駒澤大) / 野宮 浩揮(京都工繊大)
幹事補佐氏名(英) Ken Honda(Komazawa Univ.) / Hiroki Nomiya(Kyoto Inst. of Tech)

講演論文情報詳細
申込み研究会 Technical Committee on Data Engineering / Special Interest Group on Database System
本文の言語 JPN-ONLY
タイトル(和) 転置インデクスを用いた動的なテキスト集合に対する類似検索の高速化
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 類似検索
キーワード(2)(和/英) テキストストリーム
キーワード(3)(和/英) 転置インデクス
キーワード(4)(和/英) 枝刈りアルゴリズム
第 1 著者 氏名(和/英) 土田 祐将 / Yuma Tsuchida
第 1 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 2 著者 氏名(和/英) 古賀 久志 / Hisashi Koga
第 2 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
発表年月日 2021-12-27
資料番号 DE2021-15
巻番号(vol) vol.121
号番号(no) DE-314
ページ範囲 pp.1-6(DE),
ページ数 6
発行日 2021-12-20 (DE)