講演名 2007-09-11
オントロジーを用いたHTMLからのRDFデータ抽出
竹内 成博, 森田 武史, 和泉 憲明, 山口 高平,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) セマンティックWebを実現するためには,既存のWebページに対して機械可読なRDF形式のデータを提供する必要がある.しかし,Web上にはすでに膨大なHTML形式のWebページがあり,それらに対して人手によってRDF形式のデータを提供することは困難である.本研究では,HTMLで記述されたWebページからデータを抽出し,オントロジーを用いることでRDF形式のデータに変換する手法を提案する.この手法により,従来の手法と比べて,HTMLからRDFを抽出するコストを下げることが出来る.
抄録(英) In producing RDF descriptions efficiently with huge numbers of Web pages described by HTML, there are two ways of approaching: GRDDL[1] like method with embedded meta-data and Scraper like method with changing HTML descriptions into RDF. Focusing on the latter method, we propose a new RDF creating method, using Ontology. Some case studies show us that this new RDF creating method works better compared with conventional ones.
キーワード(和) セマンティックWeb / RDF / オントロジー / RDF洗練
キーワード(英) Semantic Web / RDF / Ontology / RDF Cleansing
資料番号 KBSE2007-22
発行日

研究会情報
研究会 KBSE
開催期間 2007/9/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Knowledge-Based Software Engineering (KBSE)
本文の言語 JPN
タイトル(和) オントロジーを用いたHTMLからのRDFデータ抽出
サブタイトル(和)
タイトル(英) Ontology Based RDF Extraction from HTML
サブタイトル(和)
キーワード(1)(和/英) セマンティックWeb / Semantic Web
キーワード(2)(和/英) RDF / RDF
キーワード(3)(和/英) オントロジー / Ontology
キーワード(4)(和/英) RDF洗練 / RDF Cleansing
第 1 著者 氏名(和/英) 竹内 成博 / Naruhiro TAKEUCHI
第 1 著者 所属(和/英) 慶應義塾大学理工学研究科
Keio University
第 2 著者 氏名(和/英) 森田 武史 / Takeshi MORITA
第 2 著者 所属(和/英) 慶應義塾大学理工学研究科
Keio University
第 3 著者 氏名(和/英) 和泉 憲明 / Noriaki Izumi
第 3 著者 所属(和/英) 産業技術総合研究所
National Institute of AIST
第 4 著者 氏名(和/英) 山口 高平 / Takahira YAMAGICHI
第 4 著者 所属(和/英) 慶應義塾大学理工学研究科
Keio University
発表年月日 2007-09-11
資料番号 KBSE2007-22
巻番号(vol) vol.107
号番号(no) 212
ページ範囲 pp.-
ページ数 6
発行日