講演名 2000/7/12
NLC2000-19 相対インデックス法による文構造分析法の開発と結果
雄山 真弓, 岡田 孝, 黒崎 茂樹,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) データマイニングは、大規模データベースから新しい知見の獲得-これまで予期できなかったパターンの導出、新しいルールの導出-を行う方法である。構造を持つデータを対象とするデータマイニングの手法をコーパスデータに適用すれば、これまで発見できなかった文構造上の新たな知見が得られるであろう。本論文は、はじめに構文解析木の表記法について論じ、相対インデックス法を構造のあるデータに適用し、これまで行われてこなかった構造を持つデータを対象とするデータマイニングの手法を開発した報告を行う。次に、EDRの英語コーパスデータを用いて自動詞のthinkと他動詞のthinkを含む文の構文構造上の特徴について、分析を行った結果を報告する。
抄録(英) Data mining deals with the discovery of hidden knowledge, unexpected patterns and new rules from large databases. Corpuses are large databases and text-mining techniques are making rapid progress. If we apply the technique of data mining to discover knowledge in corpuses, we will get good results. But, to analyze corpuses with syntactic parse trees we have to treat their structures. In this paper, we show the inscription of syntactic parse tree first and we propose the data mining methods using the relative indexing of vertices for knowledge discover from corpuses. We show the distinctive structural features found between an intransitive verb"think"and a transitive verb"think".
キーワード(和) データマイニング / 相対インデックス / 構文解析木 / 知識発見
キーワード(英) data mining / relative indexing / syntactic parse tree / knowledge discovery
資料番号 NLC2000-19
発行日

研究会情報
研究会 NLC
開催期間 2000/7/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) NLC2000-19 相対インデックス法による文構造分析法の開発と結果
サブタイトル(和)
タイトル(英) Data Mining of Sentence Structures using Relative Indexing of Vertices
サブタイトル(和)
キーワード(1)(和/英) データマイニング / data mining
キーワード(2)(和/英) 相対インデックス / relative indexing
キーワード(3)(和/英) 構文解析木 / syntactic parse tree
キーワード(4)(和/英) 知識発見 / knowledge discovery
第 1 著者 氏名(和/英) 雄山 真弓 / Mayumi OYAMA
第 1 著者 所属(和/英) 関西学院大学情報メディア教育センター
Center for Information & Media Studies, Kwansei Gakuin University
第 2 著者 氏名(和/英) 岡田 孝 / Takashi OKADA
第 2 著者 所属(和/英) 関西学院大学情報メディア教育センター
Center for Information & Media Studies, Kwansei Gakuin University
第 3 著者 氏名(和/英) 黒崎 茂樹 / Shigeki KUROSAKI
第 3 著者 所属(和/英) 関西学院大学情報メディア教育センター
Center for Information & Media Studies, Kwansei Gakuin University
発表年月日 2000/7/12
資料番号 NLC2000-19
巻番号(vol) vol.100
号番号(no) 201
ページ範囲 pp.-
ページ数 8
発行日