講演名 | 2015-03-05 非負値行列因子分解を利用した文書クラスタリング手法の提案(ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,及び一般) 小西 葉月, 小川 貴英, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 近年,インターネットを利用して情報収集する機会が増えている.しかし,検索結果が膨大かつ重複しているため,自分が意図する情報にたどり着けないことや現在どのような話題があるのか把握できないことがある.そこで本研究では,文書クラスタリングにて話題毎に検索結果の分類を行う.文書クラスタリングには次元縮約を応用した手法である非負値行列因子分解を利用する.しかし,非負値行列因子分解には,基底数決定の問題と解が一意に決まらない問題がある.そこで本研究では,基底数を2とし,分解を繰り返して残った文書集合を最終的にクラスタとすることで基底数決定の自動化を行った.また,文書とクラスタの関連度,索引語クラスタの関連度を用いてクラスタリング評価関数を導入し,クラスタリング最適解を決定した.提案手法の検証は,リアルタイム性があり話題が豊富なTwitterで行った. |
抄録(英) | In recent years, people have more opportunities to gather information using the Internet. But user can't get information as a user intends or user can't grasp current topics because the result is enormous and overlap. This paper classifies search results in every topic by Document Clustering and uses Non-negative Matrix Factorization (NMF) in Document Clustering. Unfortunately NFM needs the number of clusters before calculation and gives many answers. As a solution for this problem, this paper proposes that resolution is repeated and cluster evaluate using association between document and cluster degree and between word and cluster degree. |
キーワード(和) | 文書クラスタリング / 非負値行列因子分解 / Twitter |
キーワード(英) | Document Clustering / Non-necative Matrix Factorization / Twitter |
資料番号 | LOIS2014-65 |
発行日 |
研究会情報 | |
研究会 | LOIS |
---|---|
開催期間 | 2015/2/26(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Life Intelligence and Office Information Systems (LOIS) |
---|---|
本文の言語 | JPN |
タイトル(和) | 非負値行列因子分解を利用した文書クラスタリング手法の提案(ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,及び一般) |
サブタイトル(和) | |
タイトル(英) | Document Clustering Method Using Non-negative Matrix Factorization |
サブタイトル(和) | |
キーワード(1)(和/英) | 文書クラスタリング / Document Clustering |
キーワード(2)(和/英) | 非負値行列因子分解 / Non-necative Matrix Factorization |
キーワード(3)(和/英) | Twitter / Twitter |
第 1 著者 氏名(和/英) | 小西 葉月 / Hazuki KONISHI |
第 1 著者 所属(和/英) | 津田塾大学大学院理学研究科 Graduate School of Mathematics and Computer Science, Tsuda College |
第 2 著者 氏名(和/英) | 小川 貴英 / Takahide OGAWA |
第 2 著者 所属(和/英) | 津田塾大学学芸学部情報科学科 Computer Science, Tsuda College |
発表年月日 | 2015-03-05 |
資料番号 | LOIS2014-65 |
巻番号(vol) | vol.114 |
号番号(no) | 500 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |