講演名 1998/7/23
コーパスからの日本語従属節係り受け選好情報の抽出
西岡山 滋之, 宇津呂 武仁, 松本 裕治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 日本語の長文で一文中に従属節が複数個存在する場合, それらの節の間の係り受け関係を一意に認定することは非常に困難である.また, このことが日本語の長文を構文解析する時に最大のボトルネックの一つとなっている.本論文では, 大量の構文解析済コーパスから, 統計的手法により, 従属節節末表現の間の係り受け関係を判定する規則を自動抽出する手法を提案する.統計的手法として, 決定リストの学習の手法を用いることにより, 係り側・受け側の従属節の形態素上の特徴と, 二つの従属節が係り受け関係にあるか否かの間の因果関係を分析し, この因果関係を考慮して, 従属節節末表現の間の係り受け関係判定規則を学習する.また, 実際に, EDR日本語コーパスから抽出した係り受け情報を用いて, 本論文の手法の有効性を検討した結果についても述べる.
抄録(英) Dependeny analysisi of Japanese subordinate clauses is one of the most difficult phase in the syntactic analysis of Japanese long setences. This paper proposes a corpus-based method of learning preference rule of deciding dependency relation of Japanese subordinate clauses. We utilize morphological cues included in the subordinate clauses and statistically estimate the co-relation of those cues and dependency relation of Japanese subordinate clauses. In the experimental evalution on EDR Japanese parsed corpus, we discover that there exist several morphological cues that are quite effective in deciding dependency relation of Japanese subordinate clauses.
キーワード(和) 統計的言語解析 / 日本語従属節 / 係り受け解析 / コーパス / 決定リスト / 選好
キーワード(英) statistical language processing / Japanese subordinate clause / dependency analysis / corpus / decision list / preference
資料番号 NLC98-11
発行日

研究会情報
研究会 NLC
開催期間 1998/7/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) コーパスからの日本語従属節係り受け選好情報の抽出
サブタイトル(和)
タイトル(英) Extracting Preference of Dependency between Japanese Subordinate Clauses from Corpus
サブタイトル(和)
キーワード(1)(和/英) 統計的言語解析 / statistical language processing
キーワード(2)(和/英) 日本語従属節 / Japanese subordinate clause
キーワード(3)(和/英) 係り受け解析 / dependency analysis
キーワード(4)(和/英) コーパス / corpus
キーワード(5)(和/英) 決定リスト / decision list
キーワード(6)(和/英) 選好 / preference
第 1 著者 氏名(和/英) 西岡山 滋之 / Shigeyuki Nishiokayama
第 1 著者 所属(和/英) 大阪大学言語文化研究科
Graduate School of Language and Culture, Osaka University
第 2 著者 氏名(和/英) 宇津呂 武仁 / Takehito Utsuro
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 3 著者 氏名(和/英) 松本 裕治 / Yuji Matsumoto
第 3 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
発表年月日 1998/7/23
資料番号 NLC98-11
巻番号(vol) vol.98
号番号(no) 209
ページ範囲 pp.-
ページ数 8
発行日