講演名 2001/10/10
表層的・構造的対訳対検索の長所と短所
, 岡崎 篤, 徳永 健伸, 田中 穂積,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では, Senseval2の対訳対検索タスクにおいて、2つの全く異なった検索手法を紹介する。1つ目の手法は表層的類似に基づくもので、文字列を文字バイグラムの集合として扱う。2つ目の手法は構造的類似をもととしたもので、構文解析木および概念的類似を用い文字列間の類似度を計算する。さらに、この2つの手法を組み合わせるハイブリッド手法も提案する。評価実験では、単純でありながらも、表層的類似度計算法が構造的計算法より勝ることを明らかにし、全体ではハイブリッド手法が再優良であることを実証している。
抄録(英) This paper describes two distinct translation retrieval methods within the context of the Senseval2 Japanese translation task. The first is based on lexical similarity and models strings as a bag of character bigrams, whereas the second is based on structural similarity and determines similarity via parse trees and conceptual similarity. We also discuss a hybrid approach, combining the results of the lexical and structural methods. Despite its simplistic nature, the lexical method was found to outperform the structural method by a clear margin, but the hybrid method to be the strongest overall contender.
キーワード(和) 対訳対検索 / 表層的類似 / 構造的類似
キーワード(英) translation retrieval / lexical similarity / structural similarity
資料番号 NLC 2001-38
発行日

研究会情報
研究会 NLC
開催期間 2001/10/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 ENG
タイトル(和) 表層的・構造的対訳対検索の長所と短所
サブタイトル(和)
タイトル(英) The Successes and Failures of Lexical and Stractural Translation Retrieval
サブタイトル(和)
キーワード(1)(和/英) 対訳対検索 / translation retrieval
キーワード(2)(和/英) 表層的類似 / lexical similarity
キーワード(3)(和/英) 構造的類似 / structural similarity
第 1 著者 氏名(和/英) / Timothy BALDWIN
第 1 著者 所属(和/英) Centre for the Study of Languageand Information (CSLI)
Centre for the Study of Languageand Information (CSLI)
第 2 著者 氏名(和/英) 岡崎 篤 / Atsushi OKAZAKI
第 2 著者 所属(和/英) 東京工業大学情報理工学研究科
Department of Computer Science, Graduate School of Information Science and Engineering
第 3 著者 氏名(和/英) 徳永 健伸 / Takenobu TOKUNAGA
第 3 著者 所属(和/英) 東京工業大学情報理工学研究科
Department of Computer Science, Graduate School of Information Science and Engineering
第 4 著者 氏名(和/英) 田中 穂積 / Hozumi TANAKA
第 4 著者 所属(和/英) 東京工業大学情報理工学研究科
Department of Computer Science, Graduate School of Information Science and Engineering
発表年月日 2001/10/10
資料番号 NLC 2001-38
巻番号(vol) vol.101
号番号(no) 351
ページ範囲 pp.-
ページ数 8
発行日