講演名 2000/10/3
データマイニング : ウェブデータからの知識発見を目指して
有村 博紀,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) データマイニング(DataMining)は, データベースからの知識発見とも呼ばれ, データベースに蓄積された一見無意味にみえる大量のデータから, 自明でない規則性やパターンを半自動的にとりだす方法についての科学的研究である.データマイニングの研究は, 1990年代初頭から顕在化し, 現在, ビジネス分野や科学技術分野をはじめとするさまざまな対象領域で, その適用が盛んにおこなわれている.本稿では, テキストデータとウェブデータを対象としたデータマイニング研究の最新動向について解説する.
抄録(英) The rapid progress of computer and network technologies makes it easy to store large amount of unstructured or semi-structured texts such as webpages, HTML/XML archives, and a collection of emails or text files on a computer. Thus, there is a potential demand for efficient semi-automatic tool that supports a human discovery from large text databases. In this paper, we give a short survey of the current data mining methods and their limitations in the context of text and Web mining. Then, we present efficient and robust data mining algorithms for unstructured text data based on optimized pattern discovery. We also discuss the applications of the algorithms to Web mining.
キーワード(和) データマイニング / テキストマイニング / 最適化問題 / パターン発見
キーワード(英) optimized data mining / Web mining / phrase association patterns / Discovery Science
資料番号 IT2000-32
発行日

研究会情報
研究会 IT
開催期間 2000/10/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Information Theory (IT)
本文の言語 JPN
タイトル(和) データマイニング : ウェブデータからの知識発見を目指して
サブタイトル(和)
タイトル(英) Data Mining : Towards Knowledge Discovery from Text and Web Data
サブタイトル(和)
キーワード(1)(和/英) データマイニング / optimized data mining
キーワード(2)(和/英) テキストマイニング / Web mining
キーワード(3)(和/英) 最適化問題 / phrase association patterns
キーワード(4)(和/英) パターン発見 / Discovery Science
第 1 著者 氏名(和/英) 有村 博紀 / Hiroki Arimura
第 1 著者 所属(和/英) 九州大学大学院システム情報科学研究院, 情報理学部門
Department of Informatics, Kyushu University
発表年月日 2000/10/3
資料番号 IT2000-32
巻番号(vol) vol.100
号番号(no) 332
ページ範囲 pp.-
ページ数 6
発行日