講演名 2011-01-28
ブログ記事に基づく概念属性の揺らぎ抽出(検索,第2回集合知シンポジウム)
堀内 要介, 内田 理,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 単語とその概念を表す属性で構成されたデータベースの事を概念ベースと呼び,近年情報検索システムなどに応用されている.概念ベースの構築には,一般的には辞書データが用いられるが,単語の概念属性は必ずしも固定的ではなく,様々な出来事や事件などの影響により単語の概念属性に揺らぎが生じる可能性がある.例えば,スポーツ大会の開催によって,開催国の概念属性はスポーツの属性が強くなる,もしくはスポーツの属性が新規に追加されることが予想される.本研究では,このような概念属性の揺らぎ抽出にブログ記事の活用を考える.ブログ記事はニュースの影響を強く受けているものが多く,文書数も膨大である.そこで本研究では,ブログ記事に付与されたタグに注目し,そのタグを属性とみなすことにより,様々な出来事や事件による属性への影響を抽出する手法を提案し,実験によりその有効性を検証する.
抄録(英) Concept-bases are composed of a collection of concept attributes and applied to information retrieval system recently. To construct concept-bases, the data of the dictionaries is usually used. However, concept attributes are not always static, that is, some of them change by the influence of a variety of events and happenings. For example, it is to be expected that the attributes of the sports in the concept attribute of the country holding some sports event are stronger than usual time, or they are append to the concept attribute of the country. In this study, we consider the application of weblogs to extract the fluctuations of concept attributes. Many of articles of weblogs are influenced by the news, and the number of documents of weblogs is very large. Then, in this study, we propose a new method to extract the influence of a variety of events and happenings to attributes by regarding the tags given to an article as an attribute of the words in the article, and examine the effectiveness of our method.
キーワード(和) 概念属性 / 概念ベース / ブログ / 集合知
キーワード(英) Concept Attribute / Concept-Base / Weblog / Collective Intelligence
資料番号 NLC2010-40
発行日

研究会情報
研究会 NLC
開催期間 2011/1/20(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) ブログ記事に基づく概念属性の揺らぎ抽出(検索,第2回集合知シンポジウム)
サブタイトル(和)
タイトル(英) Extraction Method for Fluctuation of Concept Attributes based on Weblogs
サブタイトル(和)
キーワード(1)(和/英) 概念属性 / Concept Attribute
キーワード(2)(和/英) 概念ベース / Concept-Base
キーワード(3)(和/英) ブログ / Weblog
キーワード(4)(和/英) 集合知 / Collective Intelligence
第 1 著者 氏名(和/英) 堀内 要介 / Yosuke HORIUCHI
第 1 著者 所属(和/英) 東海大学大学院工学研究科情報理工学専攻
Graduate School of Engineering, Tokai University
第 2 著者 氏名(和/英) 内田 理 / Osamu UCHIDA
第 2 著者 所属(和/英) 東海大学情報理工学部情報科学科
Dept. Human and Info. Science, Tokai University
発表年月日 2011-01-28
資料番号 NLC2010-40
巻番号(vol) vol.110
号番号(no) 400
ページ範囲 pp.-
ページ数 4
発行日