講演名 2015-09-11
ニュース記事を用いた地域間関連性分析手法
福地 柾斗(都立産技高専), 横井 健(都立産技高専), 小早川 倫広(都立産技高専),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ニュース記事は速報性,地域性を有する情報発信媒体のひとつであり,ある地域が関心を持つ日々のできごとを表している.本稿では,異なる地域のニュース記事における関心ごとを比較することで,地域間の関連度合いを分析できると考え,ニュース記事の集合から地域間の関連の強さを可視化する手法を提案する.提案手法では,記事の本文に含まれる名詞による記事間の類以度から非軽量多次元尺度構成法(nMDS)によって記事をユークリッド空間上に射影し,その空間上でクラスタリングを行うことで記事に新たな地域ラベルを付与する.実験では,5つの地域のニュース記事から地域間関連性の分析を試みた結果,関係性のありそうな地域ラベルが混在することを確認した.また,nMDSによって射影先のユーグリッド空間の次元数を変化させることにより,高次元で過剰適合してしまうデータに対しても有効であることを確認した.
抄録(英) News article is an information dissemination media which has promptly and locality characteristics. It shows the daily news that people in local area are interested in. We have proposed the method that visualizes the strength of relations among areas with analysis of news article in each area. The method consists of following four components for news articles assigned an area label: 1) extraction of feature from news articles, 2) calculation of similarity, 3) nonmetric multidimensional scaling (nMDS), and 4) k-means clustering. In the experiment, we have applied the proposed method to news articles which collected from five locations. As the result of experiment, we have confirmed that the area label are mixed between relational areas. Also, we have found that it is effective for the data over fitting in high dimension, by changing the projected dimension scale using nMDS.
キーワード(和) テキストマイニング / 関連性分析 / 地域性 / 視覚化
キーワード(英) text mining / relation analysis / locality / visualization
資料番号 NLC2015-28
発行日 2015-09-03 (NLC)

研究会情報
研究会 NLC
開催期間 2015/9/10(から2日開催)
開催地(和) コンベンションルーム AP渋谷道玄坂
開催地(英) Convention Room AP Shibuya-Dogenzaka (Tokyo)
テーマ(和) 第7回 テキストマイニング・シンポジウム
テーマ(英) The Seventh Text Mining Symposium
委員長氏名(和) 竹内 孔一(岡山大)
委員長氏名(英) Koichi Takeuchi(Okayama Univ.)
副委員長氏名(和) 金山 博(日本IBM) / 市瀬 眞(NTTドコモ)
副委員長氏名(英) Hiroshi Kanayama(IBM) / Makoto Ichise(NTT DoCoMo)
幹事氏名(和) 榊 剛史(東大/ホットリンク) / 渡辺 靖彦(龍谷大)
幹事氏名(英) Takeshi Sakaki(Univ. of Tokyo/Hottolink) / Yasuhiko Watanabe(Ryukoku Univ.)
幹事補佐氏名(和) 嶋田 和孝(九工大) / 東中 竜一郎(NTT)
幹事補佐氏名(英) Kazutaka Shimada(Kyushu Inst. of Tech.) / Ryuichiro Higashinaka(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication
本文の言語 JPN
タイトル(和) ニュース記事を用いた地域間関連性分析手法
サブタイトル(和)
タイトル(英) Analysis for relation among areas using news articles
サブタイトル(和)
キーワード(1)(和/英) テキストマイニング / text mining
キーワード(2)(和/英) 関連性分析 / relation analysis
キーワード(3)(和/英) 地域性 / locality
キーワード(4)(和/英) 視覚化 / visualization
第 1 著者 氏名(和/英) 福地 柾斗 / Masato Fukuchi
第 1 著者 所属(和/英) 東京都立産業技術高等専門学校(略称:都立産技高専)
Tokyo Metropolitan College of Industrial Technology(略称:TMCIT)
第 2 著者 氏名(和/英) 横井 健 / Takeru Yokoi
第 2 著者 所属(和/英) 東京都立産業技術高等専門学校(略称:都立産技高専)
Tokyo Metropolitan College of Industrial Technology(略称:TMCIT)
第 3 著者 氏名(和/英) 小早川 倫広 / Michihiro Kobayakawa
第 3 著者 所属(和/英) 東京都立産業技術高等専門学校(略称:都立産技高専)
Tokyo Metropolitan College of Industrial Technology(略称:TMCIT)
発表年月日 2015-09-11
資料番号 NLC2015-28
巻番号(vol) vol.115
号番号(no) NLC-222
ページ範囲 pp.53-56(NLC),
ページ数 4
発行日 2015-09-03 (NLC)