講演名 | 2007-09-11 オントロジーを用いたHTMLからのRDFデータ抽出 竹内 成博, 森田 武史, 和泉 憲明, 山口 高平, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | セマンティックWebを実現するためには,既存のWebページに対して機械可読なRDF形式のデータを提供する必要がある.しかし,Web上にはすでに膨大なHTML形式のWebページがあり,それらに対して人手によってRDF形式のデータを提供することは困難である.本研究では,HTMLで記述されたWebページからデータを抽出し,オントロジーを用いることでRDF形式のデータに変換する手法を提案する.この手法により,従来の手法と比べて,HTMLからRDFを抽出するコストを下げることが出来る. |
抄録(英) | In producing RDF descriptions efficiently with huge numbers of Web pages described by HTML, there are two ways of approaching: GRDDL[1] like method with embedded meta-data and Scraper like method with changing HTML descriptions into RDF. Focusing on the latter method, we propose a new RDF creating method, using Ontology. Some case studies show us that this new RDF creating method works better compared with conventional ones. |
キーワード(和) | セマンティックWeb / RDF / オントロジー / RDF洗練 |
キーワード(英) | Semantic Web / RDF / Ontology / RDF Cleansing |
資料番号 | KBSE2007-22 |
発行日 |
研究会情報 | |
研究会 | KBSE |
---|---|
開催期間 | 2007/9/3(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Knowledge-Based Software Engineering (KBSE) |
---|---|
本文の言語 | JPN |
タイトル(和) | オントロジーを用いたHTMLからのRDFデータ抽出 |
サブタイトル(和) | |
タイトル(英) | Ontology Based RDF Extraction from HTML |
サブタイトル(和) | |
キーワード(1)(和/英) | セマンティックWeb / Semantic Web |
キーワード(2)(和/英) | RDF / RDF |
キーワード(3)(和/英) | オントロジー / Ontology |
キーワード(4)(和/英) | RDF洗練 / RDF Cleansing |
第 1 著者 氏名(和/英) | 竹内 成博 / Naruhiro TAKEUCHI |
第 1 著者 所属(和/英) | 慶應義塾大学理工学研究科 Keio University |
第 2 著者 氏名(和/英) | 森田 武史 / Takeshi MORITA |
第 2 著者 所属(和/英) | 慶應義塾大学理工学研究科 Keio University |
第 3 著者 氏名(和/英) | 和泉 憲明 / Noriaki Izumi |
第 3 著者 所属(和/英) | 産業技術総合研究所 National Institute of AIST |
第 4 著者 氏名(和/英) | 山口 高平 / Takahira YAMAGICHI |
第 4 著者 所属(和/英) | 慶應義塾大学理工学研究科 Keio University |
発表年月日 | 2007-09-11 |
資料番号 | KBSE2007-22 |
巻番号(vol) | vol.107 |
号番号(no) | 212 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |