講演名 2017-09-07
実テキストの情報分析のための頑健な言語処理基盤
河原 大輔(京大), 黒橋 禎夫(京大), 林部 祐太(フェアリーデバイセズ), 森田 一(富士通研), Arseny Tolmachev(京大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ブログ、tweet、SNSなどの実テキストには、物事や商品・サービスに関する評価、意見などの人々の生の声が書かれており、人が意思決定をするとき、あるいは企業が自社の商品の評価を分析する上で貴重な情報源となる。これらの実テキストの分析を計算機で支援するためには、未知語や表記ゆれに対して頑健な形態素解析・構文解析などの基盤解析が必要となる。本論文では、実テキストの情報分析のための頑健な言語処理基盤について議論する。
抄録(英) On real texts, such as blog articles, tweets and SNS texts, people'sreal voices are written about evaluations and opinions on things, products and services. These are valuable information sources when people makedecisions, and companies evaluate their products. To automaticallyanalyze such real texts, it is essential to robustly perform fundamentalanalyses, such as morphological analysis and syntactic parsing, becausereal texts contain many unknown words and spelling variations. Thispaper discusses a robust language processing infrastructure forinformation analysis of real texts.
キーワード(和) 実テキスト / 形態素解析 / 構文解析 / 語彙知識
キーワード(英) real texts / morphological analysis / syntactic parsing / lexical knowledge
資料番号 NLC2017-17
発行日 2017-08-31 (NLC)

研究会情報
研究会 NLC
開催期間 2017/9/7(から2日開催)
開催地(和) 成蹊大学
開催地(英) Seikei University
テーマ(和) 第11回 テキストアナリティクス・シンポジウム
テーマ(英) The Eleventh Text Analytics Symposium
委員長氏名(和) 金山 博(日本IBM)
委員長氏名(英) Hiroshi Kanayama(IBM)
副委員長氏名(和) 榊 剛史(ホットリンク) / 嶋田 和孝(九工大)
副委員長氏名(英) Takeshi Sakaki(Hottolink) / Kazutaka Shimada(Kyushu Inst. of Tech.)
幹事氏名(和) 渡辺 靖彦(龍谷大) / 東中 竜一郎(NTT)
幹事氏名(英) Yasuhiko Watanabe(Ryukoku Univ.) / Ryuichiro Higashinaka(NTT)
幹事補佐氏名(和) 吉田 光男(豊橋技科大) / 小早川 健(NICT)
幹事補佐氏名(英) Mitsuo Yoshida(Toyohashi Univ. of Tech.) / Takeshi Kobayakawa(NICT)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication
本文の言語 JPN
タイトル(和) 実テキストの情報分析のための頑健な言語処理基盤
サブタイトル(和)
タイトル(英) Robust Language Processing Infrastructure for Information Analysis of Real Texts
サブタイトル(和)
キーワード(1)(和/英) 実テキスト / real texts
キーワード(2)(和/英) 形態素解析 / morphological analysis
キーワード(3)(和/英) 構文解析 / syntactic parsing
キーワード(4)(和/英) 語彙知識 / lexical knowledge
第 1 著者 氏名(和/英) 河原 大輔 / Daisuke Kawahara
第 1 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 2 著者 氏名(和/英) 黒橋 禎夫 / Sadao Kurohashi
第 2 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 3 著者 氏名(和/英) 林部 祐太 / Yuta Hayashibe
第 3 著者 所属(和/英) フェアリーデバイセズ株式会社(略称:フェアリーデバイセズ)
Fairy Devices Inc.(略称:Fairy Devices)
第 4 著者 氏名(和/英) 森田 一 / Hajime Morita
第 4 著者 所属(和/英) 株式会社富士通研究所(略称:富士通研)
FUJITSU LABORATORIES LTD.(略称:FUJITSU LABORATORIES)
第 5 著者 氏名(和/英) Arseny Tolmachev / Arseny Tolmachev
第 5 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
発表年月日 2017-09-07
資料番号 NLC2017-17
巻番号(vol) vol.117
号番号(no) NLC-207
ページ範囲 pp.25-30(NLC),
ページ数 6
発行日 2017-08-31 (NLC)