講演名 | 2000/7/12 NLC2000-19 相対インデックス法による文構造分析法の開発と結果 雄山 真弓, 岡田 孝, 黒崎 茂樹, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | データマイニングは、大規模データベースから新しい知見の獲得-これまで予期できなかったパターンの導出、新しいルールの導出-を行う方法である。構造を持つデータを対象とするデータマイニングの手法をコーパスデータに適用すれば、これまで発見できなかった文構造上の新たな知見が得られるであろう。本論文は、はじめに構文解析木の表記法について論じ、相対インデックス法を構造のあるデータに適用し、これまで行われてこなかった構造を持つデータを対象とするデータマイニングの手法を開発した報告を行う。次に、EDRの英語コーパスデータを用いて自動詞のthinkと他動詞のthinkを含む文の構文構造上の特徴について、分析を行った結果を報告する。 |
抄録(英) | Data mining deals with the discovery of hidden knowledge, unexpected patterns and new rules from large databases. Corpuses are large databases and text-mining techniques are making rapid progress. If we apply the technique of data mining to discover knowledge in corpuses, we will get good results. But, to analyze corpuses with syntactic parse trees we have to treat their structures. In this paper, we show the inscription of syntactic parse tree first and we propose the data mining methods using the relative indexing of vertices for knowledge discover from corpuses. We show the distinctive structural features found between an intransitive verb"think"and a transitive verb"think". |
キーワード(和) | データマイニング / 相対インデックス / 構文解析木 / 知識発見 |
キーワード(英) | data mining / relative indexing / syntactic parse tree / knowledge discovery |
資料番号 | NLC2000-19 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2000/7/12(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | NLC2000-19 相対インデックス法による文構造分析法の開発と結果 |
サブタイトル(和) | |
タイトル(英) | Data Mining of Sentence Structures using Relative Indexing of Vertices |
サブタイトル(和) | |
キーワード(1)(和/英) | データマイニング / data mining |
キーワード(2)(和/英) | 相対インデックス / relative indexing |
キーワード(3)(和/英) | 構文解析木 / syntactic parse tree |
キーワード(4)(和/英) | 知識発見 / knowledge discovery |
第 1 著者 氏名(和/英) | 雄山 真弓 / Mayumi OYAMA |
第 1 著者 所属(和/英) | 関西学院大学情報メディア教育センター Center for Information & Media Studies, Kwansei Gakuin University |
第 2 著者 氏名(和/英) | 岡田 孝 / Takashi OKADA |
第 2 著者 所属(和/英) | 関西学院大学情報メディア教育センター Center for Information & Media Studies, Kwansei Gakuin University |
第 3 著者 氏名(和/英) | 黒崎 茂樹 / Shigeki KUROSAKI |
第 3 著者 所属(和/英) | 関西学院大学情報メディア教育センター Center for Information & Media Studies, Kwansei Gakuin University |
発表年月日 | 2000/7/12 |
資料番号 | NLC2000-19 |
巻番号(vol) | vol.100 |
号番号(no) | 201 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |