講演名 2008-06-30
Webページからの地域情報取得手法(「Webインテリジェンス」及び一般)
今野 将, 藤田 茂, 渡邊 悠介,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ウェブやセンサなどの現実社会から情報を取り込み,人へのサービスを提供する地域サービス基盤を構築するためには,地方自治体のウェブサイトから地域情報を取り込む必要がある.しかし,現状のウェブサイトは,人が読むことを前提としており,視覚的に読みやすいデザインやウェブページの構成がされているため,機械処理によって情報を取得することが考慮されておらず困難である.この課題に対して,HTML文書を対象とした情報取得手法が,いくつかの技術が開発されている.しかし,テンプレートやページ中の情報量に制約があり,地域の情報に適用した場合に正しく取得できない問題があった.そこで本稿では,イベント開催情報と道路工事情報を地域情報とした地域情報の取得を行う手法を提案する.この手法では,語の意味を包含する表現となる属性語が,情報となる語の直前に記述される可能性があることに着目し,語の意味を把握することや,情報取得を行う範囲を単一ウェブページに限定せず,ハイパーリンク先の情報も取得することにより,複数のウェブページに渡り情報が記述されることがある地域情報ウェブページの情報取得に適用し,評価実験を行い動作の確認をした.
抄録(英) In recent years, the local government is offering regional information through the Web. However, the website is not made in consideration of machine processing. Some the methods of extracting information intended for the HTML document are developed for this problem. However, in the case of the regional information web pages, some problems are left in the existing method. The first is "Only same template web site". The second is "Only information of one every one page". Because there is such a problem the existing method are not applicable in the regional information web page. In this paper, we propose a method of information extraction of the regional information by the attribute word. This method grasps the meaning of the word by attribute word including the meaning of the word. And, regional information is extracted from the resemblance of case information and HTML document. In addition, the information extraction expands the object range to a hyperlink document.
キーワード(和) HTML処理 / 地域情報 / 情報取得
キーワード(英) HTML Processing / Regional Information / Information Extraction
資料番号 AI2008-8
発行日

研究会情報
研究会 AI
開催期間 2008/6/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) Webページからの地域情報取得手法(「Webインテリジェンス」及び一般)
サブタイトル(和)
タイトル(英) A Method for Extraction Regional Information from HTML Documents
サブタイトル(和)
キーワード(1)(和/英) HTML処理 / HTML Processing
キーワード(2)(和/英) 地域情報 / Regional Information
キーワード(3)(和/英) 情報取得 / Information Extraction
第 1 著者 氏名(和/英) 今野 将 / Susumu KONNO
第 1 著者 所属(和/英) 千葉工業大学
Chiba Institute of Technology
第 2 著者 氏名(和/英) 藤田 茂 / Shigeru FUJITA
第 2 著者 所属(和/英) 千葉工業大学
Chiba Institute of Technology
第 3 著者 氏名(和/英) 渡邊 悠介 / Yusuke WATANABE
第 3 著者 所属(和/英) 千葉工業大学:NTTコムウェア株式会社
Chiba Institute of Technology:NTT Comware Corporation
発表年月日 2008-06-30
資料番号 AI2008-8
巻番号(vol) vol.108
号番号(no) 119
ページ範囲 pp.-
ページ数 6
発行日