講演名 | 1996/7/18 置換えを用いたn-gramによる言語表現の抽出 内野 一, 白井 論, 池原 悟, 新田見 緑, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 機械翻訳システムにおいてユーザにあった正しいスタイルで翻訳を行なうためあらかじめ用意したテンプレートを用いて翻訳を行なう方法が知られている。このようなシステムに用いる定型的パターンを人手によって抽出することは容易でなく、これらを機械的に抽出することが必要となる。本稿では、原データに対して変換を行った後に、n-gram統計処理による共起表現の抽出をすることで、長単位の定型パターンを抽出する手法について提案する。 |
抄録(英) | In machine translation a useful method for translating repetitive text is template translation, that is using fixed templates with only a few variables. However, it is hard to compile these templates by hand. This paper describes a method of automatic extraction of template patterns from Japanese corpora using n-gram after replacirig potential variable elements with tokens. |
キーワード(和) | 自動抽出 / 定型表現 / コーパス / n-gram |
キーワード(英) | automatic extraction / template pattern / corpus / n-gram |
資料番号 | NLC96-18 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 1996/7/18(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 置換えを用いたn-gramによる言語表現の抽出 |
サブタイトル(和) | |
タイトル(英) | Automatic Extraction of Template Patterns Using n-gram with Tokens |
サブタイトル(和) | |
キーワード(1)(和/英) | 自動抽出 / automatic extraction |
キーワード(2)(和/英) | 定型表現 / template pattern |
キーワード(3)(和/英) | コーパス / corpus |
キーワード(4)(和/英) | n-gram / n-gram |
第 1 著者 氏名(和/英) | 内野 一 / Hajime UCHINO |
第 1 著者 所属(和/英) | NTTコミュニケーション科学研究所 NTT Communication Science Laboratories |
第 2 著者 氏名(和/英) | 白井 論 / Satoshi SHIRAI |
第 2 著者 所属(和/英) | NTTコミュニケーション科学研究所 NTT Communication Science Laboratories |
第 3 著者 氏名(和/英) | 池原 悟 / Satoru IKEHARA |
第 3 著者 所属(和/英) | 鳥取大学 Tottori University |
第 4 著者 氏名(和/英) | 新田見 緑 / Midori SHINTAMI |
第 4 著者 所属(和/英) | 北海道大学 Hokkaido University |
発表年月日 | 1996/7/18 |
資料番号 | NLC96-18 |
巻番号(vol) | vol.96 |
号番号(no) | 157 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |