講演名 1996/7/18
置換えを用いたn-gramによる言語表現の抽出
内野 一, 白井 論, 池原 悟, 新田見 緑,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 機械翻訳システムにおいてユーザにあった正しいスタイルで翻訳を行なうためあらかじめ用意したテンプレートを用いて翻訳を行なう方法が知られている。このようなシステムに用いる定型的パターンを人手によって抽出することは容易でなく、これらを機械的に抽出することが必要となる。本稿では、原データに対して変換を行った後に、n-gram統計処理による共起表現の抽出をすることで、長単位の定型パターンを抽出する手法について提案する。
抄録(英) In machine translation a useful method for translating repetitive text is template translation, that is using fixed templates with only a few variables. However, it is hard to compile these templates by hand. This paper describes a method of automatic extraction of template patterns from Japanese corpora using n-gram after replacirig potential variable elements with tokens.
キーワード(和) 自動抽出 / 定型表現 / コーパス / n-gram
キーワード(英) automatic extraction / template pattern / corpus / n-gram
資料番号 NLC96-18
発行日

研究会情報
研究会 NLC
開催期間 1996/7/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 置換えを用いたn-gramによる言語表現の抽出
サブタイトル(和)
タイトル(英) Automatic Extraction of Template Patterns Using n-gram with Tokens
サブタイトル(和)
キーワード(1)(和/英) 自動抽出 / automatic extraction
キーワード(2)(和/英) 定型表現 / template pattern
キーワード(3)(和/英) コーパス / corpus
キーワード(4)(和/英) n-gram / n-gram
第 1 著者 氏名(和/英) 内野 一 / Hajime UCHINO
第 1 著者 所属(和/英) NTTコミュニケーション科学研究所
NTT Communication Science Laboratories
第 2 著者 氏名(和/英) 白井 論 / Satoshi SHIRAI
第 2 著者 所属(和/英) NTTコミュニケーション科学研究所
NTT Communication Science Laboratories
第 3 著者 氏名(和/英) 池原 悟 / Satoru IKEHARA
第 3 著者 所属(和/英) 鳥取大学
Tottori University
第 4 著者 氏名(和/英) 新田見 緑 / Midori SHINTAMI
第 4 著者 所属(和/英) 北海道大学
Hokkaido University
発表年月日 1996/7/18
資料番号 NLC96-18
巻番号(vol) vol.96
号番号(no) 157
ページ範囲 pp.-
ページ数 6
発行日