大会名称 |
---|
2015年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2015 |
発行日 |
2015/08/25 |
セッション番号 |
7C |
セッション名 |
Webデータ応用 |
講演日 |
2015/09/17 |
講演場所(会議室等) |
共通教育講義棟3階 講31 |
講演番号 |
D-028 |
タイトル |
データ取得制限のあるDeep Webからのサンプルデータ収集方式 |
著者名 |
杜 翔, 大森 匡, 藤田秀之, 新谷隆彦, 邱 原, |
キーワード |
データクローリング, データサンプリング, ディープウェブ, 空間データ, 検索API |
抄録 |
従来のDeep Webのクローリングは,ニュース記事のようなテキストデータを対象としてきた.一方で,生成時刻や位置情報を持つ空間データも,さまざまなSNSのデータベースを代表とするDeep Webに大量に蓄積されている.一部のサービスでは,データを取得するためのAPIが公開されているが,全てのデータを取得されることを避けるため,さまざまな利用制限が設けられている.そこで本研究では,指定された時空間におけるサンプルデータを,検索APIの制限を考慮して,効率よく取得する手法を提案する.本稿では,大規模な写真共有サービスであるFlickrの位置情報付き写真を対象とする. |
本文pdf |
PDF download (337.4KB) |