講演名 2001/10/10
ATR-SLTシステム-SENSEVAL-2日本語翻訳タスク
熊野 正, 柏岡 秀紀, 田中 英輝,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ベクタ空間モデルを利用した翻訳選択システムを提案する.ある単語の翻訳の選択肢がその単語を含む表現とその翻訳の組として定義されているとき, 評価表現中の対象単語の翻訳を選択することは, 対象単語の文脈が評価表現と最も似ている表現を選択肢中から選択することと見なすことができる.本手法は, この文脈情報を対象単語の周辺の内容語の情報から構成される「文脈ベクタ」に表現する.文脈ベクタには, 周辺語の語彙属性(語形や意味など)と, 対象語との構文的関係(係り受けなど)からなる詳細な文脈情報を表現する.本手法を適用したシステムでSENSEVAL-2日本語翻訳タスクに参加した.評価実験の結果, 正解データへの精度, 再現率はともに45.8%(プログラムの不具合を修正後には49.3%)であった.さらに, 文脈ベクタ作成に用いる各語彙属性・構文的関係成文と翻訳選択性能との関係を調査した.その結果, 周辺語全体に対する意味属性の情報が最も性能に寄与することが分かった.それに対して, 係り受け関係にある語の情報は, 語形などの表層情報が一致するときには精度に寄与するが, 再現率が低く, 余まり性能には寄与しなかった.
抄録(英) We propose a translation selection system based on the vector space model. When each translation candidate of a word is given as a pair of expressions containing the word and its translation, selecting the translation of the word can be considered equivalent to selecting the expression having the most similar context among candidate expressions. The proposed method expresses the context information in "context vectors" constructed from content words co-occurring with the target word. Context vectors represent detailed information composed of lexical attributes (word forms, semantic codes, etc.) and syntactic relations (syntactic dependency, etc.) of the co-occurring words. We tested the proposed method with the SENSEVAL-2 Japanese translation task. Precision/recall was 45.8% (49.4%, after bugelimination) to the gold standard in the experiment with the evaluation set. Furthermore, we examined the correlation between translation selection accuracy and each of lexical attribute and syntactic relation. The result shows that the semantic attributes of all context words make the greatest contribution to the performance. On the other hand, context words in some dependency relations makes contribution when they have silimar surface information, such as word forms, but make less contribution because of low recall rate.
キーワード(和) 翻訳選択 / 多義解消 / ベクタ空間モデル / SENSEVAL-2日本語翻訳タスク
キーワード(英) translation selection / disambiguation / vector space model / SENSEVAL-2 Japanese translation task
資料番号 NLC 2001-37
発行日

研究会情報
研究会 NLC
開催期間 2001/10/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) ATR-SLTシステム-SENSEVAL-2日本語翻訳タスク
サブタイトル(和)
タイトル(英) ATR-SLT System for SENSEVAL-2 Japanese Translation Task
サブタイトル(和)
キーワード(1)(和/英) 翻訳選択 / translation selection
キーワード(2)(和/英) 多義解消 / disambiguation
キーワード(3)(和/英) ベクタ空間モデル / vector space model
キーワード(4)(和/英) SENSEVAL-2日本語翻訳タスク / SENSEVAL-2 Japanese translation task
第 1 著者 氏名(和/英) 熊野 正 / Tadashi KUMANO
第 1 著者 所属(和/英) ATR音声言語通信研究所
ATR Spoken Language Translation Research Laboratories
第 2 著者 氏名(和/英) 柏岡 秀紀 / Hideki KASHIOKA
第 2 著者 所属(和/英) ATR音声言語通信研究所
ATR Spoken Language Translation Research Laboratories
第 3 著者 氏名(和/英) 田中 英輝 / Hideki TANAKA
第 3 著者 所属(和/英) ATR音声言語通信研究所
ATR Spoken Language Translation Research Laboratories
発表年月日 2001/10/10
資料番号 NLC 2001-37
巻番号(vol) vol.101
号番号(no) 351
ページ範囲 pp.-
ページ数 7
発行日