講演名 | 1995/12/15 文節間係り受け距離の統計的性質とその係り受け解析への応用 張 玉潔, 尾関 和彦, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 日本語における2文節間の係り受け頻度はその距離に依存することが知られている。すなわち,ほとんどの文節はその直後の文節に係ることが最も多く,文末の文節を除いては,距離が離れるにしたがってその頻度が減少する。このような統計的知識が日本語文の表層的解析に有効であるかどうかを確かめるため,総ペナルテイ最小化法を用いて,係り受け解析の実験を行なった。ATRの503文データベースから抽出した係り受け距離の頻度分布に基づいていくつかのペナルテイ関数を定義し,結果を比較したところ,このような統計的知識が実際に解析性能向上に有効であること,また頻度分布は係り文節の種類ごとに求めた方がよいことなどが明らかとなった。 |
抄録(英) | It is well known that, in the Japanese language, the frequency of pairs of phrases in modifier-modified relation depends on the distance between the phrases. That is, most phrases modify their immediate successors most frequently, and unless the modified phrase is the last one in a sentence, the frequency decreases as the distance between the modifier phrase and the modified phrase increases. In order to see whether statistical knowledge of this kind is useful for dependency analysis of Japanese sentences, a number of analysis experiments were carried out by using the minimum total penalty method. Based on the statistical knowledge extracted from ATR 503-sentence database, several penalty functions were defined, and the analysis results were evaluated. Through these experiments, it was confirmed that the knowledge of dependency distance distribution is effective for improving the analysis performance, and that better performance can be obtained if the knowledge of frequency distribution is extracted separately for each category to which the modifier phrase belongs. |
キーワード(和) | 係り受け解析 / 係り受けの整合性 / 係り受け距離 / 係り受け規則 / 統計的言語知識 / 総ぺナルテイ最小化 |
キーワード(英) | dependency analysis / degree of dependency / dependency distance / dependency rule / statistical linguistic knowledge / minimization of total penalty |
資料番号 | NLC95-67 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 1995/12/15(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 文節間係り受け距離の統計的性質とその係り受け解析への応用 |
サブタイトル(和) | |
タイトル(英) | Statistical Property of Distance between Modifier and Modified Phrases and Its Application to Dependency Analysis of Japanese Sentences |
サブタイトル(和) | |
キーワード(1)(和/英) | 係り受け解析 / dependency analysis |
キーワード(2)(和/英) | 係り受けの整合性 / degree of dependency |
キーワード(3)(和/英) | 係り受け距離 / dependency distance |
キーワード(4)(和/英) | 係り受け規則 / dependency rule |
キーワード(5)(和/英) | 統計的言語知識 / statistical linguistic knowledge |
キーワード(6)(和/英) | 総ぺナルテイ最小化 / minimization of total penalty |
第 1 著者 氏名(和/英) | 張 玉潔 / Yujie ZHANG |
第 1 著者 所属(和/英) | 電気通信大学 The University of Electro-Communications |
第 2 著者 氏名(和/英) | 尾関 和彦 / Kazuhiko OZEKI |
第 2 著者 所属(和/英) | 電気通信大学 The University of Electro-Communications |
発表年月日 | 1995/12/15 |
資料番号 | NLC95-67 |
巻番号(vol) | vol.95 |
号番号(no) | 429 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |