講演名 | 2001/10/10 表層的・構造的対訳対検索の長所と短所 , 岡崎 篤, 徳永 健伸, 田中 穂積, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本研究では, Senseval2の対訳対検索タスクにおいて、2つの全く異なった検索手法を紹介する。1つ目の手法は表層的類似に基づくもので、文字列を文字バイグラムの集合として扱う。2つ目の手法は構造的類似をもととしたもので、構文解析木および概念的類似を用い文字列間の類似度を計算する。さらに、この2つの手法を組み合わせるハイブリッド手法も提案する。評価実験では、単純でありながらも、表層的類似度計算法が構造的計算法より勝ることを明らかにし、全体ではハイブリッド手法が再優良であることを実証している。 |
抄録(英) | This paper describes two distinct translation retrieval methods within the context of the Senseval2 Japanese translation task. The first is based on lexical similarity and models strings as a bag of character bigrams, whereas the second is based on structural similarity and determines similarity via parse trees and conceptual similarity. We also discuss a hybrid approach, combining the results of the lexical and structural methods. Despite its simplistic nature, the lexical method was found to outperform the structural method by a clear margin, but the hybrid method to be the strongest overall contender. |
キーワード(和) | 対訳対検索 / 表層的類似 / 構造的類似 |
キーワード(英) | translation retrieval / lexical similarity / structural similarity |
資料番号 | NLC 2001-38 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2001/10/10(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | ENG |
タイトル(和) | 表層的・構造的対訳対検索の長所と短所 |
サブタイトル(和) | |
タイトル(英) | The Successes and Failures of Lexical and Stractural Translation Retrieval |
サブタイトル(和) | |
キーワード(1)(和/英) | 対訳対検索 / translation retrieval |
キーワード(2)(和/英) | 表層的類似 / lexical similarity |
キーワード(3)(和/英) | 構造的類似 / structural similarity |
第 1 著者 氏名(和/英) | / Timothy BALDWIN |
第 1 著者 所属(和/英) | Centre for the Study of Languageand Information (CSLI) Centre for the Study of Languageand Information (CSLI) |
第 2 著者 氏名(和/英) | 岡崎 篤 / Atsushi OKAZAKI |
第 2 著者 所属(和/英) | 東京工業大学情報理工学研究科 Department of Computer Science, Graduate School of Information Science and Engineering |
第 3 著者 氏名(和/英) | 徳永 健伸 / Takenobu TOKUNAGA |
第 3 著者 所属(和/英) | 東京工業大学情報理工学研究科 Department of Computer Science, Graduate School of Information Science and Engineering |
第 4 著者 氏名(和/英) | 田中 穂積 / Hozumi TANAKA |
第 4 著者 所属(和/英) | 東京工業大学情報理工学研究科 Department of Computer Science, Graduate School of Information Science and Engineering |
発表年月日 | 2001/10/10 |
資料番号 | NLC 2001-38 |
巻番号(vol) | vol.101 |
号番号(no) | 351 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |