講演名 2011-10-10
英語におけるスラング表現のテキスト標準化のためのルールに基づく手法(応用,自然言語処理)
クラーク エレナ, 荒木 健治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和)
抄録(英) This research introduces an experimental system for the automated normalization of casual, irregularly-formed English used in communications such as Twitter. Our rule-based approach aims to avoid problems caused by user creativity and individuality of language when Twitter-style text is used as input in Machine Translation, and to aid comprehension for non-native speakers of English. We describe the results of two evaluation experiments using our system. Finally, we explore how to effectively utilize the same rule-based approach to generate casual English ; in other words, automatically producing humanlike creative sentences as an AI task.
キーワード(和)
キーワード(英) Natural Language Processing / Text Normalization / Noisy Text / Twitter / Machine Translation
資料番号 TL2011-27,NLC2011-24
発行日

研究会情報
研究会 NLC
開催期間 2011/10/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 ENG
タイトル(和) 英語におけるスラング表現のテキスト標準化のためのルールに基づく手法(応用,自然言語処理)
サブタイトル(和)
タイトル(英) A Rule-based Method of Text Normalization for Casual English
サブタイトル(和)
キーワード(1)(和/英) / Natural Language Processing
第 1 著者 氏名(和/英) クラーク エレナ / Eleanor CLARK
第 1 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Science and Technology, Hokkaido University
第 2 著者 氏名(和/英) 荒木 健治 / Kenji ARAKI
第 2 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Science and Technology, Hokkaido University
発表年月日 2011-10-10
資料番号 TL2011-27,NLC2011-24
巻番号(vol) vol.111
号番号(no) 228
ページ範囲 pp.-
ページ数 6
発行日