講演名 | 2011-07-07 特徴的な記述を利用した問題発見手法の実現(知識発見,第1回テキストマイニング・シンポジウム) 村上 拓真, 那須川 哲哉, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | テキストマイニングの典型的な目的のひとつに,潜在的な問題をいち早く発見するという課題がある.本稿では,問題や不具合の記述に特徴的に現れる連用修飾表現から単語間の関係をたどり,分析対象として適した動詞や名詞を抽出する手法について論ずる.この手法によって,文書集合の対象分野や言語に依存せず,有用なテキストマイニングに必要な分析対象を汎用的に発見することができる. |
抄録(英) | One of typical goals of text mining is to detect potential problems from a document set of natural language. This paper discusses a method to find the significant nouns and verbs to be analyzed in a given document set. This method starts from adverbs unique to problem descriptions and follows the relationships between words to detect the nouns and verbs that describe the actual problems. This method does not depend on the domain or the language of the document set and constructs a useful set of words for the effective text mining of the given document set. |
キーワード(和) | テキストマイニング / 不具合表現抽出 / 辞書構築 |
キーワード(英) | Text Mining / Trouble identification / Lexicon creation |
資料番号 | NLC2011-7 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2011/6/30(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 特徴的な記述を利用した問題発見手法の実現(知識発見,第1回テキストマイニング・シンポジウム) |
サブタイトル(和) | |
タイトル(英) | Detecting potential issues based on typical problem description |
サブタイトル(和) | |
キーワード(1)(和/英) | テキストマイニング / Text Mining |
キーワード(2)(和/英) | 不具合表現抽出 / Trouble identification |
キーワード(3)(和/英) | 辞書構築 / Lexicon creation |
第 1 著者 氏名(和/英) | 村上 拓真 / Takuma MURAKAMI |
第 1 著者 所属(和/英) | 日本IBMソフトウェア開発研究所 IBM Japan Yamato Software Development Laboratory |
第 2 著者 氏名(和/英) | 那須川 哲哉 / Tetsuya NASUKAWA |
第 2 著者 所属(和/英) | 日本IBM東京基礎研究所 IBM Research-Tokyo |
発表年月日 | 2011-07-07 |
資料番号 | NLC2011-7 |
巻番号(vol) | vol.111 |
号番号(no) | 119 |
ページ範囲 | pp.- |
ページ数 | 5 |
発行日 |