講演名 2001/7/9
用例ベース翻訳のためのパラレルコーパスからの対訳対発見
荒牧 英治, 黒橋 禎夫, 佐藤 理史, 渡辺 日出雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿は、文同士の対応がとられた日本語と英語の対訳文を入力し、句レベルで対訳対を発見するシステムについて述べる。本システムは最初に辞書引きを行い対訳対を発見する。その後に周辺の統語情報や文全体の整合性から他の対訳対を発見する。本システムは約70%のカバレージで80%の精度で対訳対を発見することに成功した。文同士は非常に適切に対応しているパラレルコーパスにおいては、本手法は従来の統計的手法よりも有効であると考えられる。
抄録(英) This paper describes a system for finding translation correspondences from parsed parellel corpus that is the paired dependency structures of a source sentence and its translation in a target language. At first, the system we have developed finds correspondences by consulting a source-to-target word dictionary, and then finds the other remaining correspondences based on dependency structure and the balance of all correspondences. The system achieved about 70% coverage and 80% accuracy. For finding correspondences, the fact that the source sentences in parallel corpus correspond suitably with the target sentences, is available. This method can collect more correspondences than a statistical approach.
キーワード(和) 対訳対 / パラレルコーパス / 用例ベース翻訳
キーワード(英) bilingual correspondences / parallel corpus / example-based translation
資料番号 NLC2001-12
発行日

研究会情報
研究会 NLC
開催期間 2001/7/9(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 用例ベース翻訳のためのパラレルコーパスからの対訳対発見
サブタイトル(和)
タイトル(英) Finding Translation Correspondences from Parallel Parsed Corpus for Example-based Translation
サブタイトル(和)
キーワード(1)(和/英) 対訳対 / bilingual correspondences
キーワード(2)(和/英) パラレルコーパス / parallel corpus
キーワード(3)(和/英) 用例ベース翻訳 / example-based translation
第 1 著者 氏名(和/英) 荒牧 英治 / Eiji Aramaki
第 1 著者 所属(和/英) 京都大学大学院情報学研究科
Graduate School of Informatics, Kyoto University
第 2 著者 氏名(和/英) 黒橋 禎夫 / Sadao Kurohashi
第 2 著者 所属(和/英) 東京大学大学院情報理工系研究科
Graduate School of Information Science and Technology, the University of Tokyo
第 3 著者 氏名(和/英) 佐藤 理史 / Satoshi Sato
第 3 著者 所属(和/英) 京都大学大学院情報学研究科
Graduate School of Informatics, Kyoto University
第 4 著者 氏名(和/英) 渡辺 日出雄 / Hideo Watanabe
第 4 著者 所属(和/英) 日本IBM東京基礎研究所
IBM Research, Tokyo Research Laboratory
発表年月日 2001/7/9
資料番号 NLC2001-12
巻番号(vol) vol.101
号番号(no) 189
ページ範囲 pp.-
ページ数 8
発行日