講演名 2014-01-24
ツイッターにおけるデータ自動分類手法に関する研究(ネットワークソフトウェア,コンテンツ配信/流通,ソーシャルネットワーク(SNS),データ分析・処理基盤,ビッグデータ及び一般)
米川 あかり, 長岡 健一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では、代表的なソーシャルメディアのひとつであるTwitterを用いて、膨大なユーザーの意見を自動的に分類し、可視化することを目的とする。例えば、ある話題に対するユーザーの意見を肯定・否定等に分類し、その割合を可視化することで、世論調査などに利用できるのではないかと考えられる。本システムでは、まず無作為抽出したツイートから、ツイートに含まれる形態素それ自体と、形態素の直後の語との組み合わせである連続した形態素の、肯定・否定・その他のツイートへの出現確率を有する教師データベースを作成する。そしてその教師データベースを元に、ツイートに含まれる形態素及び連続した形態素が肯定・否定・その他である確率から、ツイート全体が肯定・否定・その他である確率を求めることで、ツイートを判定、分類する。一般的なツイートを自動判定した結果、特に肯定・否定の二つのみに分類した場合において、ある程度正確な判定が得られた。また、限定的な話題に関するツイートに対しての分類を行った結果、話題によっては、判定の難しい事例がみられた。
抄録(英) The purpose of this study is classifying tweets automatically and visualizing the results. Specifically, this research attempts to classify automatically sentiments on specific subject to positive or negative, and visualize the results to research the public opinion. To begin with, we build the supervised database, which is consisted by frequency of morphemes and consecutive morphemes, in a positive, negative or other tweet, from random sampled tweets classified manually. By depending on this supervised database, tweets are classified to positive, negative or others. The result of our experiment classifying general tweets shows accurate classification to a certain degree, especially when classifying to positive or negative without others. On the other hand, it is clarified that for specific subject, difficult examples have been seen in case that tweets include no any words which directly show its sentiment.
キーワード(和) ソーシャルメディア / 情報可視化 / Twitter / 形態素解析 / ビッグデータ
キーワード(英) Social media / Information visualization / Twitter / Morphological analysis / Big data
資料番号 IN2013-132
発行日

研究会情報
研究会 IN
開催期間 2014/1/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Information Networks (IN)
本文の言語 JPN
タイトル(和) ツイッターにおけるデータ自動分類手法に関する研究(ネットワークソフトウェア,コンテンツ配信/流通,ソーシャルネットワーク(SNS),データ分析・処理基盤,ビッグデータ及び一般)
サブタイトル(和)
タイトル(英) A study on automatic classification method for Twitter "Big Data"
サブタイトル(和)
キーワード(1)(和/英) ソーシャルメディア / Social media
キーワード(2)(和/英) 情報可視化 / Information visualization
キーワード(3)(和/英) Twitter / Twitter
キーワード(4)(和/英) 形態素解析 / Morphological analysis
キーワード(5)(和/英) ビッグデータ / Big data
第 1 著者 氏名(和/英) 米川 あかり / Akari YONEKAWA
第 1 著者 所属(和/英) 石川工業高等専門学校専攻科電子機械工学専攻
Ishikawa National College of Technology
第 2 著者 氏名(和/英) 長岡 健一 / Kenichi NAGAOKA
第 2 著者 所属(和/英) 石川工業高等専門学校専攻科電子機械工学専攻
Ishikawa National College of Technology
発表年月日 2014-01-24
資料番号 IN2013-132
巻番号(vol) vol.113
号番号(no) 389
ページ範囲 pp.-
ページ数 5
発行日