講演名 | 2013-02-18 Wikipedia Infoboxから抽出した多言語属性情報の分析(言語グリッドと異文化コラボレーション) 胡 寅駿, 林 良彦, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 近年, Wikipediaから構造化された情報を抽出する研究が盛んになっており,特に言語間リンクによるWikipediaの多言語性を利用する研究が数多くなされている.本研究では,このWikipediaの多言語性のほか, WikipediaにあるInfoboxと呼ばれる半構造化された情報に着目し,日本語,中国語,および英語のWikipediaから,多言語属性情報を抽出する手法を提案する.提案手法の評価実験から,共有属性変数と呼ぶ手がかりが有用であること,属性名や属性値が補完情報として利用可能であること,を確認した.さらに,提案手法を異文化コミュニケーション支援に適用する可能性について検討した. |
抄録(英) | Wikipedia has attracted many researchers trying to extract structured information from its resources. In this research, we particularly draw attention on the multilingualism of Wikipedia and the semi-structured table-like information (Infobox) provided in each of the Wikipedia articles. More precisely, this research aims to establish a useful computational mechanism to extract multilingual attribute information from the Infobox templates and the actual Wikipedia articles in Japanese, Chinese, and English Wikipedias. The experimental results suggest that a clue, what we call attribute variables, plays a significant role in achieving high precision, and the overall performance can be further improved by incorporating attribute names and values. |
キーワード(和) | Wikipedia / Infobox / 多言語性 / 情報抽出 / 属性変数言語間リンク |
キーワード(英) | Wikipedia / Infobox / Multilingualism / Infomation Extraction / Attribute Variables / Interlanguage Links |
資料番号 | AI2012-22 |
発行日 |
研究会情報 | |
研究会 | AI |
---|---|
開催期間 | 2013/2/11(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Artificial Intelligence and Knowledge-Based Processing (AI) |
---|---|
本文の言語 | JPN |
タイトル(和) | Wikipedia Infoboxから抽出した多言語属性情報の分析(言語グリッドと異文化コラボレーション) |
サブタイトル(和) | |
タイトル(英) | Surveying Multilingual Attributes extracted from Wikipedia Infoboxes |
サブタイトル(和) | |
キーワード(1)(和/英) | Wikipedia / Wikipedia |
キーワード(2)(和/英) | Infobox / Infobox |
キーワード(3)(和/英) | 多言語性 / Multilingualism |
キーワード(4)(和/英) | 情報抽出 / Infomation Extraction |
キーワード(5)(和/英) | 属性変数言語間リンク / Attribute Variables |
第 1 著者 氏名(和/英) | 胡 寅駿 / Yinjun HI |
第 1 著者 所属(和/英) | 大阪大学言語文化研究科 Graduate School of Language and Culture, Osaka University |
第 2 著者 氏名(和/英) | 林 良彦 / Yoshihiko HAYASHI |
第 2 著者 所属(和/英) | 大阪大学言語文化研究科 Graduate School of Language and Culture, Osaka University |
発表年月日 | 2013-02-18 |
資料番号 | AI2012-22 |
巻番号(vol) | vol.112 |
号番号(no) | 435 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |