講演名 1998/7/23
書き換え規則と文脈情報を用いた形態素解析後処理
久光 徹, 丹羽 芳樹,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報では, 日本語形態素解析における誤りを, 書き換え規則により修正する後処理方法について述べる.書き換え規則は, 誤り主導型教師付き学習により生成する.すなわち, 誤りを含む解析結果と正解の差分から, 語彙的なルールから, 字種や品詞だけを用いるルールまでを含む, さまざまな抽象度のルールを生成し, 正解データに適用してそれらの信頼度を評価する.後処理は複数の文集合ごとに行い, 上記ルールと, 集合内の各文の解析結果の相互参照により, 出力結果を修正する.実験では, 後処理により解析精度を3%程度向上させることが確認できた.
抄録(英) A method is proposed for the post-processing of Japanese morphological analysis using transformation rules and contextual information. The method corrects both segmentation errors and part-of-speech tagging errors. The transformation rules are acquired automatically by error-driven supervised learning. The rules consist of various types, such as lexicalized rules and schematic rules. Each rule is assigned a value for reliability. The rules are not specifically tailored for detecting unregistered words, but can correct errors caused by unregistered words. In addition, we propose the use of contextual information obtained from the result of analysis of neighboring sentences. The information reinforces unregistered word detection and disambiguation. The post-processing improved the precision of the analysis of an open corpus by 3%.
キーワード(和) 形態素解析 / 後処理 / 誤り駆動教師付き学習
キーワード(英) morphological analysis / post-processing / error-driven supervised learning
資料番号 NLC98-14
発行日

研究会情報
研究会 NLC
開催期間 1998/7/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 書き換え規則と文脈情報を用いた形態素解析後処理
サブタイトル(和)
タイトル(英) Post-processing of Japanese Morphological Analysis Using Transformation Rules and Contextual Information
サブタイトル(和)
キーワード(1)(和/英) 形態素解析 / morphological analysis
キーワード(2)(和/英) 後処理 / post-processing
キーワード(3)(和/英) 誤り駆動教師付き学習 / error-driven supervised learning
第 1 著者 氏名(和/英) 久光 徹 / Toru Hisamitsu
第 1 著者 所属(和/英) 日立製作所基礎研究所
Advanced Research Laboratory, Hitachi, Ltd.
第 2 著者 氏名(和/英) 丹羽 芳樹 / Yoshiki Niwa
第 2 著者 所属(和/英) 日立製作所基礎研究所
Advanced Research Laboratory, Hitachi, Ltd.
発表年月日 1998/7/23
資料番号 NLC98-14
巻番号(vol) vol.98
号番号(no) 209
ページ範囲 pp.-
ページ数 8
発行日