講演名 2006-03-06
頻出重み付き系列のマイニングアルゴリズム(一般,コミュニケーションとAI及び一般)
柴田 智幸, 中野 智文, 犬塚 信博,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) アイテム列からなる系列データベースに頻出するパターンを抽出する頻出系列マイニングは各所で重要である.英文解析等の応用では,アイテムである単語やその品詞,付加情報に適切な重みを付加しそれに応じて頻出を決めるのが適切である.単語の教育的重要度等を加味するにも重みが使える.そこで本論文では重み付き系列のマイニング問題を定義し,これを解く方法を検討する.パターンを順に後方へ拡張するPrefixSpanを重み対応に素直に拡張した場合は,系列の重みをアイテムの重みの最小値で定義した場合に限り正しいことを示す.この制限をはずすためにパターンの拡張順序を後方に限定しない方法を提案し正しさを示す.また英文コーパスに適用した実験結果を述べる.
抄録(英) The frequent sequence pattern mining from sequence databases is interesting for many applications. For applying to English sentence analysis words, part-of-speech, and other attributes may become items being consisted sequences of. Then the items should be added some weights. Also for importance of words from educational viewpoints weights must to be treated. Therefore we study algorithms for frequent weighted sequence mining. First PrefixSpan, which explore patterns from shorter ones by extending to the right, is extended a simple extension of Paper shows that it is correct only when the weight of sequence are given by the minimum weight of items. In order to overcome this restriction we give an algorithm which extends patterns without the extension direction. The correctness is proved. We also give experiments with English corpus for efficiency evaluation.
キーワード(和) データマイニング / テキストマイニング / 言語解析 / アルゴリズム
キーワード(英) datamining / text mining / language analysis / algorithms
資料番号 AI2005-42
発行日

研究会情報
研究会 AI
開催期間 2006/2/27(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 頻出重み付き系列のマイニングアルゴリズム(一般,コミュニケーションとAI及び一般)
サブタイトル(和)
タイトル(英) Mining Algorithms for Frequent Weighted Sequential Patterns
サブタイトル(和)
キーワード(1)(和/英) データマイニング / datamining
キーワード(2)(和/英) テキストマイニング / text mining
キーワード(3)(和/英) 言語解析 / language analysis
キーワード(4)(和/英) アルゴリズム / algorithms
第 1 著者 氏名(和/英) 柴田 智幸 / Tomoyuki SHIBATA
第 1 著者 所属(和/英) 名古屋工業大学大学院 工学研究科 情報工学専攻
Department of Computer Science and Engineering Craduate School of Engineering, Nagoya Institute of Technology
第 2 著者 氏名(和/英) 中野 智文 / Tomofumi NAKANO
第 2 著者 所属(和/英) 名古屋工業大学情報メディア教育センター
Center for Information and Media Studies, Nagoya Institute of Technology
第 3 著者 氏名(和/英) 犬塚 信博 / Nobuhiro INUZUKA
第 3 著者 所属(和/英) 名古屋工業大学大学院 工学研究科 情報工学専攻
Department of Computer Science and Engineering Craduate School of Engineering, Nagoya Institute of Technology
発表年月日 2006-03-06
資料番号 AI2005-42
巻番号(vol) vol.105
号番号(no) 639
ページ範囲 pp.-
ページ数 6
発行日