講演抄録/キーワード |
講演名 |
2013-09-12 14:10
Wikipediaのカテゴリ情報を用いたTwitterユーザの関心分野の抽出 ○胡 寅駿・谷田泰郎(シナジーマーケティング) NLC2013-17 |
抄録 |
(和) |
本稿では,Wikipediaのカテゴリ特性に注目し,Wikipediaのカテゴリネットワークを利用してTwitterユーザの関心分野を抽出する手法を提案する.Twitterのデータには,語義曖昧性が多数存在するため,本研究では,まずWikipedia のカテゴリ「曖昧さ回避」を用いてTwitter データにおける語義曖昧性の解消をする.そして,Wikipediaのカテゴリネットワークを情報資源として,曖昧性解消したデータに分野情報を付加し,Twitter ユーザが関心する分野を抽出する. |
(英) |
Recently, Twitter becomes widely spread and owns a large number of users what attracts much attention for text mining research. In this paper, we propose a method of extracting concerned area of Twitter user using category information from Wikipedia. Twitter is a huge information repository, however, there is much word-sense ambiguation in Twitter data. Our approach is using the disambiguation pages of Wikipedia to do the word-sense disambiguation for the Twitter data. Finally, we categorized the disambiguated Twitter data by Wikipedia category information and treated the categorized data as the concerned area of the Twitter user. |
キーワード |
(和) |
ツイート / 関心分野 / テキストマイニング / Wikipedia / カテゴリ / / / |
(英) |
Tweets / Concerned Area / Text mining / Wikipedia / Category / / / |
文献情報 |
信学技報, vol. 113, no. 213, NLC2013-17, pp. 17-21, 2013年9月. |
資料番号 |
NLC2013-17 |
発行日 |
2013-09-05 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
査読に ついて |
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります. |
PDFダウンロード |
NLC2013-17 |