講演名 2000/12/15
多重クラスTrigram構築のための効率的な自動クラスタリング手法
磯貝 俊太郎, 白井 克彦, 山本 博史, 匂坂 芳典,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿は, 多重クラスtrigramのための効率的な自動クラスタリング手法を提案する.従来手法のように単語履歴をクラスタリングするのではなく, 'DUAME Language Modelingを用いた単語trigramの近似手法'を自動クラスタリング手法へ適応することにより, 効率的に自動クラスタリングを行うことが出来る.本手法で分類したクラスを基に多重クラスtrigramを構築した結果, 単語trigramの100分の1以下のパラメータサイズであるにもかかわらず, パープレキシティ・単語認識率による評価で共に単語trigramを上回る性能を示した.
抄録(英) In this paper, an efficient automatic word clustering method is proposed for Multi-Class Trigrams. The third position words in the trigrams are directly clustered using 'word trigram approximation by DUAME Language Modeling'. Therefore, conventional word-history clustering is not required. The Multi-Class Trigrams based on these classes showed better performance both in perplexity and recognition rates compared to conventional word trigrams. Additionally the parameter size can be reduced down to one percent.
キーワード(和) クラスN-gram / 多重クラスN-gram / 自動クラス分類 / DUAME Language Modeling
キーワード(英) Class N-gram / Autimatic Clustering / Multi-Class N-gram / DUAME Language Modeling
資料番号 NLC2000-64,SP2000-112
発行日

研究会情報
研究会 NLC
開催期間 2000/12/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 多重クラスTrigram構築のための効率的な自動クラスタリング手法
サブタイトル(和)
タイトル(英) The efficient method of automatic clustering for Multi-Class Trigrams
サブタイトル(和)
キーワード(1)(和/英) クラスN-gram / Class N-gram
キーワード(2)(和/英) 多重クラスN-gram / Autimatic Clustering
キーワード(3)(和/英) 自動クラス分類 / Multi-Class N-gram
キーワード(4)(和/英) DUAME Language Modeling / DUAME Language Modeling
第 1 著者 氏名(和/英) 磯貝 俊太郎 / Shuntaro ISOGAI
第 1 著者 所属(和/英) 早稲田大学理工学部
School of Science and Engineering, Waseda University
第 2 著者 氏名(和/英) 白井 克彦 / Katsuhiko SHIRAI
第 2 著者 所属(和/英) 早稲田大学理工学部
School of Science and Engineering, Waseda University
第 3 著者 氏名(和/英) 山本 博史 / Hirofumi YAMAMOTO
第 3 著者 所属(和/英) ATR音声言語通信研究所
ATR Spoken Language Translation Research Laboratories
第 4 著者 氏名(和/英) 匂坂 芳典 / Yoshinori SAGISAKA
第 4 著者 所属(和/英) ATR音声言語通信研究所
ATR Spoken Language Translation Research Laboratories
発表年月日 2000/12/15
資料番号 NLC2000-64,SP2000-112
巻番号(vol) vol.100
号番号(no) 521
ページ範囲 pp.-
ページ数 5
発行日