講演名 2011-07-07
特徴的な記述を利用した問題発見手法の実現(知識発見,第1回テキストマイニング・シンポジウム)
村上 拓真, 那須川 哲哉,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) テキストマイニングの典型的な目的のひとつに,潜在的な問題をいち早く発見するという課題がある.本稿では,問題や不具合の記述に特徴的に現れる連用修飾表現から単語間の関係をたどり,分析対象として適した動詞や名詞を抽出する手法について論ずる.この手法によって,文書集合の対象分野や言語に依存せず,有用なテキストマイニングに必要な分析対象を汎用的に発見することができる.
抄録(英) One of typical goals of text mining is to detect potential problems from a document set of natural language. This paper discusses a method to find the significant nouns and verbs to be analyzed in a given document set. This method starts from adverbs unique to problem descriptions and follows the relationships between words to detect the nouns and verbs that describe the actual problems. This method does not depend on the domain or the language of the document set and constructs a useful set of words for the effective text mining of the given document set.
キーワード(和) テキストマイニング / 不具合表現抽出 / 辞書構築
キーワード(英) Text Mining / Trouble identification / Lexicon creation
資料番号 NLC2011-7
発行日

研究会情報
研究会 NLC
開催期間 2011/6/30(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 特徴的な記述を利用した問題発見手法の実現(知識発見,第1回テキストマイニング・シンポジウム)
サブタイトル(和)
タイトル(英) Detecting potential issues based on typical problem description
サブタイトル(和)
キーワード(1)(和/英) テキストマイニング / Text Mining
キーワード(2)(和/英) 不具合表現抽出 / Trouble identification
キーワード(3)(和/英) 辞書構築 / Lexicon creation
第 1 著者 氏名(和/英) 村上 拓真 / Takuma MURAKAMI
第 1 著者 所属(和/英) 日本IBMソフトウェア開発研究所
IBM Japan Yamato Software Development Laboratory
第 2 著者 氏名(和/英) 那須川 哲哉 / Tetsuya NASUKAWA
第 2 著者 所属(和/英) 日本IBM東京基礎研究所
IBM Research-Tokyo
発表年月日 2011-07-07
資料番号 NLC2011-7
巻番号(vol) vol.111
号番号(no) 119
ページ範囲 pp.-
ページ数 5
発行日