講演名 2011-01-28
Webサイトの構造情報を集約する集合知データベースの構築(Web・データベース,第2回集合知シンポジウム)
江渡 浩一郎, 沢田 洋平,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) Webサイトの情報をプログラムから利用するにはWebページの構造情報が必要となるが,その構造は各々のWebサイト毎に異なっている.我々は,多数のWebサイトの構造情報を保持する集合知データベース「Wedata」を構築・運用している.ユーザはWebサイトの構造情報をメタデータとして抽出・登録することができ,これにより一連のWebページの情報を統一的な手法で利用可能となる.特に,Webサイトの機能を拡張するブラウザ拡張からの利用を想定している.現在125件のデータベース数にて,4万件以上のデータが登録されており,全世界のユーザから一月に2400万回以上のアクセスがある.本論文では,Wedataの構築・運用における知見をまとめる.
抄録(英) We propose a method for collecting and utilizing structure information appearing on various Web pages using the collective intelligence of an unspecified number of users (DataWiki method). This method enables flexible utilization of large amounts of information available on diversified Web Pages from external applications. We built and operated a database (Wedata) that anyone using the Internet can edit. In addition, we developed an application (AutoPagerize) for utilization. Using them, we collected over 40,000 items of structure information with 125 databases. This paper describes basic concepts of the DataWiki method, system implementation, and findings obtained through its operation.
キーワード(和) 集合知 / Web / Wiki / メタデータ / microformats
キーワード(英) Collective Intelligence / Web / Wiki / Metadata / microformats
資料番号 NLC2010-44
発行日

研究会情報
研究会 NLC
開催期間 2011/1/20(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) Webサイトの構造情報を集約する集合知データベースの構築(Web・データベース,第2回集合知シンポジウム)
サブタイトル(和)
タイトル(英) Constructing Collective Intelligence Database for Web Site Structure Aggregation
サブタイトル(和)
キーワード(1)(和/英) 集合知 / Collective Intelligence
キーワード(2)(和/英) Web / Web
キーワード(3)(和/英) Wiki / Wiki
キーワード(4)(和/英) メタデータ / Metadata
キーワード(5)(和/英) microformats / microformats
第 1 著者 氏名(和/英) 江渡 浩一郎 / Koichiro ETO
第 1 著者 所属(和/英) 独立行政法人産業技術総合研究所社会知能技術研究ラボ
Social Intelligence Technology Research Laboratory, National Institute of Advanced Industrial Science and Technology (AIST)
第 2 著者 氏名(和/英) 沢田 洋平 / Youhei SAWADA
第 2 著者 所属(和/英) 独立行政法人産業技術総合研究所社会知能技術研究ラボ
Social Intelligence Technology Research Laboratory, National Institute of Advanced Industrial Science and Technology (AIST)
発表年月日 2011-01-28
資料番号 NLC2010-44
巻番号(vol) vol.110
号番号(no) 400
ページ範囲 pp.-
ページ数 6
発行日