講演名 2000/3/21
事例の意味・構造情報の双方を利用したHTMLからXMLへの変換
梅原 雅之, 岩沼 宏治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 現在インターネット上には極めて多量のHTML文書が存在し、そこは情報の宝庫となっている。しかし、HTML文書はブラウザで閲覧するか、印刷するためにあらかじめ設計されており、機械的処理には向いていない。そこで本論文には、事例に基づくHTML文書からXML文書への変換手法を提案する。HTML文書をXML文書に変換することにより、インターネット上のHTML文書で記述された多量な情報の機械的処理が容易になると考えられる。本論文で提案する手法は、事例に基づく変換手法であり変換事例の意味情報と構造情報の双方を利用する。実在のHTML文書の変換実験を通して、提案手法の有用性を示す。
抄録(英) Recently, a large quantity of HTML documents exist on Internet, accordingly Internet is treasury of information. However, HTML documents aren't suitable for machine processing, because HTML documents made for reading by browser, or print beforehand. In this paper, we propose a case base conversion method from HTML documents into XML documents. It makes easy machine processing of information which was written by HTML on Internet to convert into XML. The method use both of meaning and structure information of an example. We show the value of the method proposed through experiment on the conversion of HTML documents which existing on Internet.
キーワード(和) HTMLからXMLへの変換 / 意味情報 / 構造情報
キーワード(英) conversion from HTML into XML / meaning information / structure information
資料番号 AI99-98,KBSE99-57
発行日

研究会情報
研究会 KBSE
開催期間 2000/3/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Knowledge-Based Software Engineering (KBSE)
本文の言語 JPN
タイトル(和) 事例の意味・構造情報の双方を利用したHTMLからXMLへの変換
サブタイトル(和)
タイトル(英) The Conversion from HTML into XML Using Both of Meaning and Structure Information
サブタイトル(和)
キーワード(1)(和/英) HTMLからXMLへの変換 / conversion from HTML into XML
キーワード(2)(和/英) 意味情報 / meaning information
キーワード(3)(和/英) 構造情報 / structure information
第 1 著者 氏名(和/英) 梅原 雅之 / Masayuki Umehara
第 1 著者 所属(和/英) 山梨大学コンピユータ・メディア工学科
Dept.of Computer Science and Media Engineering Yamanashi University
第 2 著者 氏名(和/英) 岩沼 宏治 / Koji Iwanuma
第 2 著者 所属(和/英) 山梨大学コンピユータ・メディア工学科
Dept.of Computer Science and Media Engineering Yamanashi University
発表年月日 2000/3/21
資料番号 AI99-98,KBSE99-57
巻番号(vol) vol.99
号番号(no) 719
ページ範囲 pp.-
ページ数 8
発行日