講演名 2005-05-31
系列パターンマイニングにおけるアイテム集合間の関連強度による頻出部分系列の絞込み(「自動推論: 帰納, 演繹, モデル検査/生成, 学習, 発見, 仮説推論, 論理プログラミング, プランニングetc.」及び一般)
大塚 尚貴, 岩沼 宏治, 鍋島 英知,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ニュースなどの続報や話題という時系列的関連をもつテキストデータを追跡するために, 時系列な関係にあるイベントを補完する辞書があれば便利である.高野らは, 数年分の新聞記事データベース中に頻出する時系列を効率よく抽出する手法を提案している.しかし, この手法により抽出される頻出時系列は大量にあり, その中にはノイズが多数含まれている.ノイズを人手によって取り除くことは大変な労力がかかるため, 我々は相互情報量的尺度として関連強度を定義し, それによって頻出系列を絞り込む方法を提案する.提案手法の有用性を確かめるため, 毎日新聞の記事から抽出された頻出時系列に対して評価実験を行った.実験結果は, 系列数を大幅に削りながらも有用な頻出時系列を含む割合が増加傾向を示した.
抄録(英) Takano at al proposed the total frequency measure that finds out all frequent sequential patterns in a single large-scale data sequence. But, this measure extracts too many frequent sequential patterns which may include noisy patterns. In this paper, we propose a method that can narrow frequent patterns with a relation strength like the mutual information between elements in a sequence. This method drastically reduces the number of frequent sequential patterns. and the ratio of remaining valid sequential patterns increased.
キーワード(和) データマイニング / 系列パターンマイニング / 相互情報量
キーワード(英) Data Mining / Sequential Pattern Mining / Mutual Information
資料番号 AI2005-5
発行日

研究会情報
研究会 AI
開催期間 2005/5/24(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 系列パターンマイニングにおけるアイテム集合間の関連強度による頻出部分系列の絞込み(「自動推論: 帰納, 演繹, モデル検査/生成, 学習, 発見, 仮説推論, 論理プログラミング, プランニングetc.」及び一般)
サブタイトル(和)
タイトル(英) Narrowing Frequent Patterns by Relation Strength in Sequencial Pattern Mining
サブタイトル(和)
キーワード(1)(和/英) データマイニング / Data Mining
キーワード(2)(和/英) 系列パターンマイニング / Sequential Pattern Mining
キーワード(3)(和/英) 相互情報量 / Mutual Information
第 1 著者 氏名(和/英) 大塚 尚貴 / Naoki OHTSUKA
第 1 著者 所属(和/英) 山梨大学大学院医学工学総合教育部修士課程
Computer Science and Media Engineering, Interdisciplinary, Graduate School of Medicine and Engineering, University of Yamanashi
第 2 著者 氏名(和/英) 岩沼 宏治 / Koji IWANUMA
第 2 著者 所属(和/英) 山梨大学大学院医学工学総合研究部
Interdiscipinary Graduate School of Medicine and Engineering, University of Yamanashi
第 3 著者 氏名(和/英) 鍋島 英知 / Hidetomo NABESHIMA
第 3 著者 所属(和/英) 山梨大学大学院医学工学総合研究部
Interdiscipinary Graduate School of Medicine and Engineering, University of Yamanashi
発表年月日 2005-05-31
資料番号 AI2005-5
巻番号(vol) vol.105
号番号(no) 105
ページ範囲 pp.-
ページ数 6
発行日