講演名 2010-02-23
Wikipediaを用いた中日カタカナ翻訳辞書の作成と言語グリッドヘの応用(言語グリッドと異文化コラボレーション)
吉岡 真治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 辞書を利用する機械翻訳システムにおいて、未登録語が多く存在する文書の翻訳結果は、質の悪いものとなる。しかし、辞書のメンテナンスは非常にコストがかかり、新語や、時事的な単語を辞書に継続的に登録することは容易ではない。本研究では、このような機械翻訳の辞書を補完するという目標のもとに、Wikipediaの言語間リンクを用いて中日の翻訳辞書を作成する方法を提案する。また、この翻訳辞書の活用事例として、多言語ニュースサイトの比較分析システムNSContrastの紹介を行う。
抄録(英) The quality of the machine translation results based on dictionary relies on the quality of the dictionary. However, since maintenance cost of the dictionary is expensive, it is not easy to cover newly generated words. In this research, we propose to use Wikipedia as a resource for Chinese-Japanese dictionary. We also explain NSContrast as an example of using this dictionary.
キーワード(和) 機械翻訳 / 辞書 / 未知語 / Wikipedia
キーワード(英) Machine translation / Dictionary / Unknown words / Wikipedia
資料番号 AI2009-37
発行日

研究会情報
研究会 AI
開催期間 2010/2/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) Wikipediaを用いた中日カタカナ翻訳辞書の作成と言語グリッドヘの応用(言語グリッドと異文化コラボレーション)
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 機械翻訳 / Machine translation
キーワード(2)(和/英) 辞書 / Dictionary
キーワード(3)(和/英) 未知語 / Unknown words
キーワード(4)(和/英) Wikipedia / Wikipedia
第 1 著者 氏名(和/英) 吉岡 真治 / Masaharu YOSHIOKA
第 1 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Sciecne and Technology, Hokkaido University
発表年月日 2010-02-23
資料番号 AI2009-37
巻番号(vol) vol.109
号番号(no) 424
ページ範囲 pp.-
ページ数 4
発行日