講演名 | 2011-10-10 英語におけるスラング表現のテキスト標準化のためのルールに基づく手法(応用,自然言語処理) クラーク エレナ, 荒木 健治, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | |
抄録(英) | This research introduces an experimental system for the automated normalization of casual, irregularly-formed English used in communications such as Twitter. Our rule-based approach aims to avoid problems caused by user creativity and individuality of language when Twitter-style text is used as input in Machine Translation, and to aid comprehension for non-native speakers of English. We describe the results of two evaluation experiments using our system. Finally, we explore how to effectively utilize the same rule-based approach to generate casual English ; in other words, automatically producing humanlike creative sentences as an AI task. |
キーワード(和) | |
キーワード(英) | Natural Language Processing / Text Normalization / Noisy Text / Twitter / Machine Translation |
資料番号 | TL2011-27,NLC2011-24 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2011/10/3(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | ENG |
タイトル(和) | 英語におけるスラング表現のテキスト標準化のためのルールに基づく手法(応用,自然言語処理) |
サブタイトル(和) | |
タイトル(英) | A Rule-based Method of Text Normalization for Casual English |
サブタイトル(和) | |
キーワード(1)(和/英) | / Natural Language Processing |
第 1 著者 氏名(和/英) | クラーク エレナ / Eleanor CLARK |
第 1 著者 所属(和/英) | 北海道大学大学院情報科学研究科 Graduate School of Information Science and Technology, Hokkaido University |
第 2 著者 氏名(和/英) | 荒木 健治 / Kenji ARAKI |
第 2 著者 所属(和/英) | 北海道大学大学院情報科学研究科 Graduate School of Information Science and Technology, Hokkaido University |
発表年月日 | 2011-10-10 |
資料番号 | TL2011-27,NLC2011-24 |
巻番号(vol) | vol.111 |
号番号(no) | 228 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |