講演名 1997/10/17
主題・焦点を用いた文脈解析の一手法
吉田 悦子, 横山 晶一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 談話構造を解析するためには主題を抽出して、そのつながりを見ることが必要であるが、主題の抽出方法が曖昧であったために主題を中心とした解析ができなかった。本研究では文を動詞文、形容詞文、名詞文に分け、それぞれに制約を設けて処理することにより、主題・焦点の抽出をアルゴリズム化した。このアルゴリズムを実際のテキストに適用したところ、83.9%の正答率であった。次に、抽出された主題を用いて談話の流れの解析を試みた。解析は、主題にラベルを付け、そのラベルから話題の推移形式を導くという方法で行った。主題の情報だけでつながりが見えなかった場合は、主題にかかる句の要素にもラベル付けし、集合として捉え、集合同士のつながりを導いた。その結果、主題を用いて話題の推移を解析することが可能になった。
抄録(英) In order to analyze the discourse structure, it is necessary to derive the themes and track their connections. The method to derive the theme has been so ambiguos that no analysis could be performed using the theme. This paper firstly classifies the sentences into verb, adjective, and noun ones. Based on the restriction for their types, the algorithm to derive themes and focuses is obtained. The application of this algorithm to the practical text makes 83.9% successful rate. Secondly, the context in discourse is analyzed using the derived themes. The analysis is made by labelling the themes, and then deriving the transfer fo the topic types using the label. In the result, it is possible to analyze the transfer of the topics.
キーワード(和) 主題 / 焦点 / 文脈解析 / 談話 / 話題
キーワード(英) theme / focus / context analysis / discourse / topic
資料番号 NLC97-29
発行日

研究会情報
研究会 NLC
開催期間 1997/10/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 主題・焦点を用いた文脈解析の一手法
サブタイトル(和)
タイトル(英) A Context Analysis Method Using Themes and Focuses
サブタイトル(和)
キーワード(1)(和/英) 主題 / theme
キーワード(2)(和/英) 焦点 / focus
キーワード(3)(和/英) 文脈解析 / context analysis
キーワード(4)(和/英) 談話 / discourse
キーワード(5)(和/英) 話題 / topic
第 1 著者 氏名(和/英) 吉田 悦子 / Etsuko YOSHIDA
第 1 著者 所属(和/英) 山形大学大学院工学研究科
Graduate course of Engineering, Yamagata University
第 2 著者 氏名(和/英) 横山 晶一 / Shoichi YOKOYAMA
第 2 著者 所属(和/英) 山形大学工学部
Faculty of Engineering, Yamagata University
発表年月日 1997/10/17
資料番号 NLC97-29
巻番号(vol) vol.97
号番号(no) 330
ページ範囲 pp.-
ページ数 8
発行日