講演名 2006-07-13
人物情報辞典の自動生成のための時系列情報自動収集(ウェブ属性抽出)
木村 塁, 小山 聡, 田中 克己,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) Web上には人物に関する情報が多く存在するが,それらWeb上の人物情報は,個人のプロフィールページ,ニュース記事,プログ記事など,様々な形態で散在している.このため,ユーザがある人物に関する情報を知るためには,多くのページを閲覧する必要があり,さらにページの中から所望の人物に関する記述を見つけ出す必要がある.我々の研究では,Web上から人物情報を自動的に収集し,人物情報辞典を自動生成する事で,ユーザが効率良く人物情報を手に入れる事を目的とする.本稿では,人物情報辞典の自動生成の第一段階として,ある特定の人物に関するWeb上の文書の集合から,西暦や元号など多様な表記をされる時間の表現を収集し,時間の表記法を統一する手法を述べる,またその時間表現と共に記述されている人物に関する記述を収集し,人物に関する記述を時系列順に提示する事で年表を生成する手法を提案する.
抄録(英) There is much information about people in the Web, and such information is written on various web pages like profile pages, news articles, or blog articles, etc. In order to know information about a specific person from the Web, users have to browse many web pages and they also have to find out statements about the person in each page. In our research, we make it our aim to collect automatically information about people from the Web, to generate automatically a dictionary about people, and to help users know such information efficiently. In this paper, as the first stage of automatically generating a dictionary about people, we suggest a method to collect terms for time, which are written in various formats like western calendar or Japanese traditional era name, and to standardize a notation of these terms. In addition, we suggest a method to collect statements about people which co-occur with those terms. Using both standardized terms for time and statements about people, we present an automatically generated chronologic table of people.
キーワード(和) Webとインターネット / 情報検索
キーワード(英) Web and Internet / Information Retrieval
資料番号 DE2006-57
発行日

研究会情報
研究会 DE
開催期間 2006/7/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) 人物情報辞典の自動生成のための時系列情報自動収集(ウェブ属性抽出)
サブタイトル(和)
タイトル(英) Generating a dictionary about people based on automatic collection of timeline information
サブタイトル(和)
キーワード(1)(和/英) Webとインターネット / Web and Internet
キーワード(2)(和/英) 情報検索 / Information Retrieval
第 1 著者 氏名(和/英) 木村 塁 / Rui KIMURA
第 1 著者 所属(和/英) 京都大学大学院情報学研究科社会情報学専攻
Department of Social Informatics, Graduate School of Informatics, Kyoto University
第 2 著者 氏名(和/英) 小山 聡 / Satoshi OYAMA
第 2 著者 所属(和/英) 京都大学大学院情報学研究科社会情報学専攻
Department of Social Informatics, Graduate School of Informatics, Kyoto University
第 3 著者 氏名(和/英) 田中 克己 / Katsumi TANAKA
第 3 著者 所属(和/英) 京都大学大学院情報学研究科社会情報学専攻
Department of Social Informatics, Graduate School of Informatics, Kyoto University
発表年月日 2006-07-13
資料番号 DE2006-57
巻番号(vol) vol.106
号番号(no) 149
ページ範囲 pp.-
ページ数 6
発行日