講演名 2011-01-25
半教師付き学習を用いた話題出現頻度推移からの注目話題の早期発見(知能ソフトウェア工学)
高橋 宏圭, 安村 禎明, 上原 邦昭,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,ブログから注目話題の早期発見を行う手法を提案する.本手法では,一部で話題になりその後全体に広まった注目話題の出現頻度推移から学習することで,一部で話題になっているものが注目話題に発展するかを判別する.学習には十分な量のラベル付きデータを確保する必要があるが,このためには膨大なコストがかかる.そこで半教師付き学習を用いて注目話題を早期に発見する手法を提案する.本手法ではまず,ブログをカテゴリに分類し,そのカテゴリ内で盛り上がった話題を抽出する.抽出した話題を今後ブログ全体で盛り上がる候補として,分類器で今後盛り上がるかどうかを判別する.実データを用いた実験の結果,半教師付き学習によって注目話題の分類器を作成可能であることを示した.
抄録(英) This report presents a method for early potential topic detection from blog articles. Potential topic is defined as a phrase which has potential to spread through many blogs. To discover potential topics, this method learns from topic frequency transitions in blog articles. Though this learning requires sufficient amount of labeled data, labeling data is costly and time consuming. Therefore this method employs a semi-supervised learning to reduce labeling cost. First, this method extracts candidates of potential topics from categorized blog articles. To detect potential topics from the candidates, a classifier is built from topic frequency transition. The experimental results with real data show the effectiveness of the proposed method.
キーワード(和) 半教師付き学習 / バースト検出 / ブログ / 早期発見 / 注目話題
キーワード(英) semi-supervised learning / burst detection / blog / early-detection / focused topic
資料番号 KBSE2010-40
発行日

研究会情報
研究会 KBSE
開催期間 2011/1/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Knowledge-Based Software Engineering (KBSE)
本文の言語 JPN
タイトル(和) 半教師付き学習を用いた話題出現頻度推移からの注目話題の早期発見(知能ソフトウェア工学)
サブタイトル(和)
タイトル(英) Early Topic Detection from Topic Frequency Transition with Semi-supervised Learning(Knowledge-Based Software Engineering)
サブタイトル(和)
キーワード(1)(和/英) 半教師付き学習 / semi-supervised learning
キーワード(2)(和/英) バースト検出 / burst detection
キーワード(3)(和/英) ブログ / blog
キーワード(4)(和/英) 早期発見 / early-detection
キーワード(5)(和/英) 注目話題 / focused topic
第 1 著者 氏名(和/英) 高橋 宏圭 / Hiroyoshi TAKAHASHI
第 1 著者 所属(和/英) 神戸大学システム情報学研究科
Graduate School of System informatics, Kobe University
第 2 著者 氏名(和/英) 安村 禎明 / Yoshiaki YASUMURA
第 2 著者 所属(和/英) 芝浦工業大学工学部
College of Engineering, Shibaura Institute of Technology
第 3 著者 氏名(和/英) 上原 邦昭 / Kuniaki UEHARA
第 3 著者 所属(和/英) 神戸大学システム情報学研究科
Graduate School of System informatics, Kobe University
発表年月日 2011-01-25
資料番号 KBSE2010-40
巻番号(vol) vol.110
号番号(no) 386
ページ範囲 pp.-
ページ数 6
発行日