講演名 2008-06-30
SVMに基づくテンプレートを考慮したWebページの分割手法について(「Webインテリジェンス」及び一般)
伊藤 太樹, 浅見 昌平, 大囿 忠親, 新谷 虎松,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,携帯電話を用いてPC向けのWebページを容易に閲覧するシステムを試作した.本稿では,Webページを意味的に類似している矩形に分割する手法について述べる.分割する粒度は,矩形の用途に応じて変わる.そこで,本手法ではレイアウト情報をSVMを用いた機械学習にて,その用途に適した分割を行う.また,Webサイトごとのレイアウト情報の差異を考慮するために,Webページをレイアウトテンプレートに従って分類しておく.評価実験の結果から,本手法の有効性について議論する.
抄録(英) We implemented a web browsing system to facilitate navigation and reading on mobile phones with small screen. The system segments web pages to blocks and generates the web page listed the blocks. The block should be the semantic part of the web page and has suitable size. In this paper, we propose a web page segmentation algorithm based on template by using support vector machine. Experimental result show that the proposed method has higher precision than method non-based on template.
キーワード(和) Webページ分割 / Webページレイアウト / 携帯電話 / Webブラウザ / 情報抽出
キーワード(英) Web Page Segmentation / Web Page Layout / Mobile Phones / Web Browser / Information Extraction
資料番号 AI2008-14
発行日

研究会情報
研究会 AI
開催期間 2008/6/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) SVMに基づくテンプレートを考慮したWebページの分割手法について(「Webインテリジェンス」及び一般)
サブタイトル(和)
タイトル(英) On a Web Page Segmentation Algorithm based on Template by using Support Vector Machine
サブタイトル(和)
キーワード(1)(和/英) Webページ分割 / Web Page Segmentation
キーワード(2)(和/英) Webページレイアウト / Web Page Layout
キーワード(3)(和/英) 携帯電話 / Mobile Phones
キーワード(4)(和/英) Webブラウザ / Web Browser
キーワード(5)(和/英) 情報抽出 / Information Extraction
第 1 著者 氏名(和/英) 伊藤 太樹 / Taiki ITO
第 1 著者 所属(和/英) 名古屋工業大学大学院情報工学専攻
Dept. of Computer Science and Engineering, Graduate School of Engineering, Nagoya Institute of Technology
第 2 著者 氏名(和/英) 浅見 昌平 / Shohei ASAMI
第 2 著者 所属(和/英) 名古屋工業大学大学院情報工学専攻
Dept. of Computer Science and Engineering, Graduate School of Engineering, Nagoya Institute of Technology
第 3 著者 氏名(和/英) 大囿 忠親 / Tadachika OZONO
第 3 著者 所属(和/英) 名古屋工業大学大学院情報工学専攻
Dept. of Computer Science and Engineering, Graduate School of Engineering, Nagoya Institute of Technology
第 4 著者 氏名(和/英) 新谷 虎松 / Toramatsu SHINTANI
第 4 著者 所属(和/英) 名古屋工業大学大学院情報工学専攻
Dept. of Computer Science and Engineering, Graduate School of Engineering, Nagoya Institute of Technology
発表年月日 2008-06-30
資料番号 AI2008-14
巻番号(vol) vol.108
号番号(no) 119
ページ範囲 pp.-
ページ数 6
発行日