お知らせ 研究会の開催と会場に参加される皆様へのお願い(2020年10月開催~)
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2010-11-19 15:45
役割に基づくWebページの分割手法とその応用について
佐野博之土井達也白松 俊大囿忠親新谷虎松名工大AI2010-41
抄録 (和) 本稿で提案するWebページ分割手法では,Webページを最小ブロックという単位まで分割した後に,最小ブロックが持つ役割に基づいてブロックの結合を行う.
最小ブロックは様々な役割を持つが,本稿ではWebコンテンツのタイトルを表す最小ブロック(タイトルブロック)に着目した.
最小ブロックが持つ9つのパラメータを用いて決定木学習を行い,計算機によるタイトルブロックの自動抽出を試みた.
評価実験では95%の精度でタイトルブロックの抽出に成功し,本手法が有効であることを確かめた. 
(英) Our web page segmentation method divides a web page into Smallest-Blocks, and then assemble some Smallest-Blocks into Content-Blocks.
While smallest-Blocks have many roles, we focused on the title of Web contents.
We adopted 9 parameters for each Smallest-Block in our decision tree learning,
and tried to obtain the extraction of Title-Blocks from web pages.
The experimental results show that the system can extract Title-Blocks in a 95% recall.
キーワード (和) Webマイニング / Webページ分割 / Webページレイアウト / / / / /  
(英) Web Mining / Web Page Segmentation / Web Page Layout / / / / /  
文献情報 信学技報, vol. 110, no. 301, AI2010-41, pp. 61-66, 2010年11月.
資料番号 AI2010-41 
発行日 2010-11-12 (AI) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード AI2010-41

研究会情報
研究会 AI  
開催期間 2010-11-19 - 2010-11-19 
開催地(和) 九州大学 
開催地(英) Kyushu Univ. 
テーマ(和) 「コミュニティ上での知識の共有・再利用」および一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 AI 
会議コード 2010-11-AI 
本文の言語 日本語 
タイトル(和) 役割に基づくWebページの分割手法とその応用について 
サブタイトル(和)  
タイトル(英) Implementing a Web Page Segmentaion Method Based on a Role of a Content 
サブタイトル(英)  
キーワード(1)(和/英) Webマイニング / Web Mining  
キーワード(2)(和/英) Webページ分割 / Web Page Segmentation  
キーワード(3)(和/英) Webページレイアウト / Web Page Layout  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 佐野 博之 / Hiroyuki Sano / サノ ヒロユキ
第1著者 所属(和/英) 名古屋工業大学大学院 (略称: 名工大)
Graduate School of Engineering, Nagoya Institute of Technology (略称: NIT)
第2著者 氏名(和/英/ヨミ) 土井 達也 / Tatsuya Doi / ドイ タツヤ
第2著者 所属(和/英) 名古屋工業大学大学院 (略称: 名工大)
Graduate School of Engineering, Nagoya Institute of Technology (略称: NIT)
第3著者 氏名(和/英/ヨミ) 白松 俊 / Shun Shiramatsu / シラマツ シュン
第3著者 所属(和/英) 名古屋工業大学大学院 (略称: 名工大)
Graduate School of Engineering, Nagoya Institute of Technology (略称: NIT)
第4著者 氏名(和/英/ヨミ) 大囿 忠親 / Tadachika Ozono / オオゾノ タダチカ
第4著者 所属(和/英) 名古屋工業大学大学院 (略称: 名工大)
Graduate School of Engineering, Nagoya Institute of Technology (略称: NIT)
第5著者 氏名(和/英/ヨミ) 新谷 虎松 / Toramatsu Shintani / シンタニ トラマツ
第5著者 所属(和/英) 名古屋工業大学大学院 (略称: 名工大)
Graduate School of Engineering, Nagoya Institute of Technology (略称: NIT)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2010-11-19 15:45:00 
発表時間 25 
申込先研究会 AI 
資料番号 IEICE-AI2010-41 
巻番号(vol) IEICE-110 
号番号(no) no.301 
ページ範囲 pp.61-66 
ページ数 IEICE-6 
発行日 IEICE-AI-2010-11-12 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会