講演名 1996/3/22
語彙化マルコフモデルによる英語品詞タグ付け
森 信介, 長尾 眞,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では、我々が提案し、日本語形態素解析に応用したマルコフモデルの語彙化を、英語の品詞タグ付けに応用した結果を報告する。マルコフモデルの語彙化における変更点は次のように要約される。 1)各品詞の語彙化、2)単語列の登録。これらの改良により、品詞単位のマルコフモデルより学習コーパスに忠実なマルコフモデルが構成される。ー方で、未知の入力に対する頑強性が損なわれる。この問題は、語彙化したマルコフモデルと品詞単位のマルコフモデルを重ね合わせることにより解決される。品詞タグ付コーパスWall Street Journalに対して実験を行なった結果、非常に高い精度を得た。
抄録(英) In this paper, we report the results of lexicalized Markov model applied to English part-of-speech tagging, which we have proposed and applied to Japanese Morphological analysis. The instructions to lexicalize Markov model are summarized as follows: 1) lexicalization of part-of-speech; 2) memorization of word sequence. This provides us with more faithful Markov models to the learning corpus. On the other hand, the lexicalized Markov models may be less robust to unknown corpora. This problem is solved by superposition of lexicalized Markov models and part-of-speech-based Markov model. We conducted experiments on Wall Street Journal corpus and obtained the considerably high accuracy.
キーワード(和) 品詞タグ付け / コーパス / 語彙化 / 連語 / マルコフモデル
キーワード(英) Part-of-speech tagging / Corpus / Lexicalize / Ideom / Markov model
資料番号 NLC-95-78
発行日

研究会情報
研究会 NLC
開催期間 1996/3/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 語彙化マルコフモデルによる英語品詞タグ付け
サブタイトル(和)
タイトル(英) English Part-of-Speech Tagging Using Lexicalized Markov Model
サブタイトル(和)
キーワード(1)(和/英) 品詞タグ付け / Part-of-speech tagging
キーワード(2)(和/英) コーパス / Corpus
キーワード(3)(和/英) 語彙化 / Lexicalize
キーワード(4)(和/英) 連語 / Ideom
キーワード(5)(和/英) マルコフモデル / Markov model
第 1 著者 氏名(和/英) 森 信介 / Shinsuke Mori
第 1 著者 所属(和/英) 京都大学工学研究科
Department of Electrical Engineering, Kyoto University
第 2 著者 氏名(和/英) 長尾 眞 / Makoto Nagao
第 2 著者 所属(和/英) 京都大学工学研究科
Department of Electrical Engineering, Kyoto University
発表年月日 1996/3/22
資料番号 NLC-95-78
巻番号(vol) vol.95
号番号(no) 601
ページ範囲 pp.-
ページ数 8
発行日