講演抄録/キーワード |
講演名 |
2017-09-07 13:35
実テキストの情報分析のための頑健な言語処理基盤 ○河原大輔・黒橋禎夫(京大)・林部祐太(フェアリーデバイセズ)・森田 一(富士通研)・Arseny Tolmachev(京大) NLC2017-17 |
抄録 |
(和) |
ブログ、tweet、SNSなどの実テキストには、物事や商品・サービスに関する評価、意見など
の人々の生の声が書かれており、人が意思決定をするとき、あるいは企業が自社
の商品の評価を分析する上で貴重な情報源となる。これらの実テキストの分析を
計算機で支援するためには、未知語や表記ゆれに対して頑健な形態素解析
・構文解析などの基盤解析が必要となる。本論文では、実テキストの
情報分析のための頑健な言語処理基盤について議論する。 |
(英) |
On real texts, such as blog articles, tweets and SNS texts, people's
real voices are written about evaluations and opinions on things,
products and services. These are valuable information sources when people make
decisions, and companies evaluate their products. To automatically
analyze such real texts, it is essential to robustly perform fundamental
analyses, such as morphological analysis and syntactic parsing, because
real texts contain many unknown words and spelling variations. This
paper discusses a robust language processing infrastructure for
information analysis of real texts. |
キーワード |
(和) |
実テキスト / 形態素解析 / 構文解析 / 語彙知識 / / / / |
(英) |
real texts / morphological analysis / syntactic parsing / lexical knowledge / / / / |
文献情報 |
信学技報, vol. 117, no. 207, NLC2017-17, pp. 25-30, 2017年9月. |
資料番号 |
NLC2017-17 |
発行日 |
2017-08-31 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2017-17 |