置換えを用いたn-gramによる言語表現の抽出

講演名	1996/7/18 置換えを用いたn-gramによる言語表現の抽出内野一, 白井論, 池原悟, 新田見緑,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	機械翻訳システムにおいてユーザにあった正しいスタイルで翻訳を行なうためあらかじめ用意したテンプレートを用いて翻訳を行なう方法が知られている。このようなシステムに用いる定型的パターンを人手によって抽出することは容易でなく、これらを機械的に抽出することが必要となる。本稿では、原データに対して変換を行った後に、n-gram統計処理による共起表現の抽出をすることで、長単位の定型パターンを抽出する手法について提案する。
抄録(英)	In machine translation a useful method for translating repetitive text is template translation, that is using fixed templates with only a few variables. However, it is hard to compile these templates by hand. This paper describes a method of automatic extraction of template patterns from Japanese corpora using n-gram after replacirig potential variable elements with tokens.
キーワード(和)	自動抽出 / 定型表現 / コーパス / n-gram
キーワード(英)	automatic extraction / template pattern / corpus / n-gram
資料番号	NLC96-18
発行日

講演論文情報詳細
申込み研究会	Natural Language Understanding and Models of Communication (NLC)
本文の言語	JPN
タイトル（和）	置換えを用いたn-gramによる言語表現の抽出
サブタイトル（和）
タイトル（英）	Automatic Extraction of Template Patterns Using n-gram with Tokens
サブタイトル（和）
キーワード(1)（和/英）	自動抽出 / automatic extraction
キーワード(2)（和/英）	定型表現 / template pattern
キーワード(3)（和/英）	コーパス / corpus
キーワード(4)（和/英）	n-gram / n-gram
第 1 著者氏名（和/英）	内野一 / Hajime UCHINO
第 1 著者所属（和/英）	NTTコミュニケーション科学研究所 NTT Communication Science Laboratories
第 2 著者氏名（和/英）	白井論 / Satoshi SHIRAI
第 2 著者所属（和/英）	NTTコミュニケーション科学研究所 NTT Communication Science Laboratories
第 3 著者氏名（和/英）	池原悟 / Satoru IKEHARA
第 3 著者所属（和/英）	鳥取大学 Tottori University
第 4 著者氏名（和/英）	新田見緑 / Midori SHINTAMI
第 4 著者所属（和/英）	北海道大学 Hokkaido University
発表年月日	1996/7/18
資料番号	NLC96-18
巻番号（vol）	vol.96
号番号（no）	157
ページ範囲	pp.-
ページ数	6
発行日