講演名 1996/7/18
日英新聞記事の自動記事対応付け
高橋 大和, 白井 諭, 藤波 進, 池原 悟, 上田 洋美, 松島 英之,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 機械翻訳などの自然言語処理技術を研究する上で、大量の対訳コーパスは非常に有用である。しかし、大量の一般的なデータの収集は困難である。本稿では、継続的なデータ収集を目的として、日英新聞記事を対象に、数値と名詞をキーワードとして利用し、その対応項目数により自動的な日英記事対応を行う手法を提案する。 この手法を用いた実験により、ー日平均90記事中38記事の正しい記事対応を自動的に得られることを確認した。
抄録(英) Bilingual Corpora are very useful in natural language processing. Unfortunately they are difficult to compile. We have developed a method in which numerical values and proper nouns in the articles are used as keywords to align the Japanese and English newspaper articles automatically in order to develop a corpus. In addition, we have developed a way to evaluate the results. We correctly align automatically an average of 38 out of 90 pairs of articles daily.
キーワード(和) 記事対応 / 対訳コーパス / データべース / 新聞記事
キーワード(英) Aligning articles / Bilingual corpora / Database / Newspaper articles
資料番号 NLC96-17
発行日

研究会情報
研究会 NLC
開催期間 1996/7/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 日英新聞記事の自動記事対応付け
サブタイトル(和)
タイトル(英) Automatically Aligning Japanese & English Newspaper Articles
サブタイトル(和)
キーワード(1)(和/英) 記事対応 / Aligning articles
キーワード(2)(和/英) 対訳コーパス / Bilingual corpora
キーワード(3)(和/英) データべース / Database
キーワード(4)(和/英) 新聞記事 / Newspaper articles
第 1 著者 氏名(和/英) 高橋 大和 / Y. Takahashi
第 1 著者 所属(和/英) NTTコミュニケーション科学研筑所
NTT Communication Science Lab.
第 2 著者 氏名(和/英) 白井 諭 / S. Shirai
第 2 著者 所属(和/英) NTTコミュニケーション科学研筑所
NTT Communication Science Lab.
第 3 著者 氏名(和/英) 藤波 進 / S. Fujinami
第 3 著者 所属(和/英) NTTコミュニケーション科学研筑所
NTT Communication Science Lab.
第 4 著者 氏名(和/英) 池原 悟 / S. Ikehara
第 4 著者 所属(和/英) 鳥取大学
Tottori Univ.
第 5 著者 氏名(和/英) 上田 洋美 / H. Ueda
第 5 著者 所属(和/英) NTTアドバンストテクノロジ(株)
NTT Advanced Technology Co.
第 6 著者 氏名(和/英) 松島 英之 / H. Matsusima
第 6 著者 所属(和/英) NTTアドバンストテクノロジ(株)
NTT Advanced Technology Co.
発表年月日 1996/7/18
資料番号 NLC96-17
巻番号(vol) vol.96
号番号(no) 157
ページ範囲 pp.-
ページ数 8
発行日