講演名 2014-08-20
クラウドソーシングを用いたレガシーオープンデータの機械可読化(「Linked Data, Linked Services」及び一般)
小山 聡, 馬場 雪乃, 大向 一輝, 堂腰 裕明, 鹿島 久嗣,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 多くの国々においてオープンデータめ取組みが進んでおり,様々な統計データが行政等によって公開されている.しかしこれらのデータは画像やPDFの形式で与えられるものが少なくなく,分析やサービスの開発などでの再利用を妨げている.そこで,クラウドソーシングを用いて,画像として与えられたレガシーな統計データを機械可読な表形式に変換する枠組みを提案する.その際,作業者に表だけを作成させるのではなく,画像をスプレッドシート上でグラフとして視覚的に再現させるタスク設計を行った.このタスク設計により,データの誤りに気付き易くなる効果に加えて,再現されたグラフオブジェクトのプロパティとして項目名や系列といったデータの構造を容易に取り出し,作業結果の統合や品質管理に利用することが可能となる.国土交通省が公開している観光白書を対象に評価実験を行い,提案手法の有効性を検証した.
抄録(英) Despite recent open data initiatives in many countries, not a few of those countries provide the data in non-machine-readable formats like an image format rather than in a machine-readable electronic format, thereby restricting their usability. An approach is described for converting legacy statistical data in an image format into a machine-readable and reusable format by using crowdsourcing. Requesting crowd workers not only to extract tables from graph images but also to reconstruct them in spreadsheets can reduce the number of errors compared to simple extraction and, at the same time, produces structures including attribute names and values as properties of the reconstructed graph objects. Experimental results using the White Paper on Tourism published by the Japan Tourism Agency demonstrated that the proposed approach is effective.
キーワード(和) クラウドソーシング / ヒューマンコンピュテーション / オープンデータ
キーワード(英) crowdsourcing / human computation / open data
資料番号 AI2014-11,SC2014-8
発行日

研究会情報
研究会 SC
開催期間 2014/8/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Services Computing (SC)
本文の言語 JPN
タイトル(和) クラウドソーシングを用いたレガシーオープンデータの機械可読化(「Linked Data, Linked Services」及び一般)
サブタイトル(和)
タイトル(英) Making Legacy Open Data Machine Readable by Crowdsourcing
サブタイトル(和)
キーワード(1)(和/英) クラウドソーシング / crowdsourcing
キーワード(2)(和/英) ヒューマンコンピュテーション / human computation
キーワード(3)(和/英) オープンデータ / open data
第 1 著者 氏名(和/英) 小山 聡 / Satoshi OYAMA
第 1 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Science and Technology, Hokkaido University
第 2 著者 氏名(和/英) 馬場 雪乃 / Yukino BABA
第 2 著者 所属(和/英) 国立情報学研究所
National Institute of Informatics
第 3 著者 氏名(和/英) 大向 一輝 / Ikki OHMUKAI
第 3 著者 所属(和/英) 国立情報学研究所
National Institute of Informatics
第 4 著者 氏名(和/英) 堂腰 裕明 / Hiroaki DOKOSHI
第 4 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Science and Technology, Hokkaido University
第 5 著者 氏名(和/英) 鹿島 久嗣 / Hisashi KASHIMA
第 5 著者 所属(和/英) 京都大学大学院情報学研究科
Graduate School of Informatics, Kyoto University
発表年月日 2014-08-20
資料番号 AI2014-11,SC2014-8
巻番号(vol) vol.114
号番号(no) 182
ページ範囲 pp.-
ページ数 6
発行日