大会名称
2015年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2015
発行日
2015/08/25
セッション番号
7C
セッション名
Webデータ応用
講演日
2015/09/17
講演場所(会議室等)
共通教育講義棟3階 講31
講演番号
D-028
タイトル
データ取得制限のあるDeep Webからのサンプルデータ収集方式
著者名
杜  翔大森 匡藤田秀之新谷隆彦邱  原
キーワード
データクローリング, データサンプリング, ディープウェブ, 空間データ, 検索API
抄録
従来のDeep Webのクローリングは,ニュース記事のようなテキストデータを対象としてきた.一方で,生成時刻や位置情報を持つ空間データも,さまざまなSNSのデータベースを代表とするDeep Webに大量に蓄積されている.一部のサービスでは,データを取得するためのAPIが公開されているが,全てのデータを取得されることを避けるため,さまざまな利用制限が設けられている.そこで本研究では,指定された時空間におけるサンプルデータを,検索APIの制限を考慮して,効率よく取得する手法を提案する.本稿では,大規模な写真共有サービスであるFlickrの位置情報付き写真を対象とする.
本文pdf
PDF download (337.4KB)