講演名 | 2001/10/10 ATR-SLTシステム-SENSEVAL-2日本語翻訳タスク 熊野 正, 柏岡 秀紀, 田中 英輝, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | ベクタ空間モデルを利用した翻訳選択システムを提案する.ある単語の翻訳の選択肢がその単語を含む表現とその翻訳の組として定義されているとき, 評価表現中の対象単語の翻訳を選択することは, 対象単語の文脈が評価表現と最も似ている表現を選択肢中から選択することと見なすことができる.本手法は, この文脈情報を対象単語の周辺の内容語の情報から構成される「文脈ベクタ」に表現する.文脈ベクタには, 周辺語の語彙属性(語形や意味など)と, 対象語との構文的関係(係り受けなど)からなる詳細な文脈情報を表現する.本手法を適用したシステムでSENSEVAL-2日本語翻訳タスクに参加した.評価実験の結果, 正解データへの精度, 再現率はともに45.8%(プログラムの不具合を修正後には49.3%)であった.さらに, 文脈ベクタ作成に用いる各語彙属性・構文的関係成文と翻訳選択性能との関係を調査した.その結果, 周辺語全体に対する意味属性の情報が最も性能に寄与することが分かった.それに対して, 係り受け関係にある語の情報は, 語形などの表層情報が一致するときには精度に寄与するが, 再現率が低く, 余まり性能には寄与しなかった. |
抄録(英) | We propose a translation selection system based on the vector space model. When each translation candidate of a word is given as a pair of expressions containing the word and its translation, selecting the translation of the word can be considered equivalent to selecting the expression having the most similar context among candidate expressions. The proposed method expresses the context information in "context vectors" constructed from content words co-occurring with the target word. Context vectors represent detailed information composed of lexical attributes (word forms, semantic codes, etc.) and syntactic relations (syntactic dependency, etc.) of the co-occurring words. We tested the proposed method with the SENSEVAL-2 Japanese translation task. Precision/recall was 45.8% (49.4%, after bugelimination) to the gold standard in the experiment with the evaluation set. Furthermore, we examined the correlation between translation selection accuracy and each of lexical attribute and syntactic relation. The result shows that the semantic attributes of all context words make the greatest contribution to the performance. On the other hand, context words in some dependency relations makes contribution when they have silimar surface information, such as word forms, but make less contribution because of low recall rate. |
キーワード(和) | 翻訳選択 / 多義解消 / ベクタ空間モデル / SENSEVAL-2日本語翻訳タスク |
キーワード(英) | translation selection / disambiguation / vector space model / SENSEVAL-2 Japanese translation task |
資料番号 | NLC 2001-37 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2001/10/10(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | ATR-SLTシステム-SENSEVAL-2日本語翻訳タスク |
サブタイトル(和) | |
タイトル(英) | ATR-SLT System for SENSEVAL-2 Japanese Translation Task |
サブタイトル(和) | |
キーワード(1)(和/英) | 翻訳選択 / translation selection |
キーワード(2)(和/英) | 多義解消 / disambiguation |
キーワード(3)(和/英) | ベクタ空間モデル / vector space model |
キーワード(4)(和/英) | SENSEVAL-2日本語翻訳タスク / SENSEVAL-2 Japanese translation task |
第 1 著者 氏名(和/英) | 熊野 正 / Tadashi KUMANO |
第 1 著者 所属(和/英) | ATR音声言語通信研究所 ATR Spoken Language Translation Research Laboratories |
第 2 著者 氏名(和/英) | 柏岡 秀紀 / Hideki KASHIOKA |
第 2 著者 所属(和/英) | ATR音声言語通信研究所 ATR Spoken Language Translation Research Laboratories |
第 3 著者 氏名(和/英) | 田中 英輝 / Hideki TANAKA |
第 3 著者 所属(和/英) | ATR音声言語通信研究所 ATR Spoken Language Translation Research Laboratories |
発表年月日 | 2001/10/10 |
資料番号 | NLC 2001-37 |
巻番号(vol) | vol.101 |
号番号(no) | 351 |
ページ範囲 | pp.- |
ページ数 | 7 |
発行日 |