講演名 2018-09-07
文学テキストの計量分析のための解釈に重点を置いた特徴量の検討
渡辺 隼(都立産技高専), 横井 健(都立産技高専),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 文学テキストの計量分析にはタスクに応じて様々な特徴量が用いられる.そのうち,テキストの解釈を目的としたタスクにおいては,分析結果を容易に解釈できること,テキストの多面的な性質を捉えることを両立するような特徴量の生成が困難であるという問題がある.本研究では,複数の特徴量,およびそれらの組み合わせ特徴量について比較を行い,特徴量の組み合わせによってこの問題を解決する方法について検討した.解釈に重点を置いた特徴量として,文体的な特徴量,単語のカテゴリにもとづく特徴量,モダリティにもとづく特徴量とそれらの組み合わせ特徴量に着目し,それらの特徴量を用いてテキストの著者に対する線形判別分析(LDA)による分析を行うことで,このアプローチの有効性を確認した.
抄録(英) Various features are used for metrical analysis of literary text, which are depending on the task. In tasks aim at interpreting texts, there are two issues such as: 1) making it easy to interpret the analysis results, 2) grasping the multifaceted nature of the text. However, it is difficult to make those issues compatible. In this research, we compare several features and their combination features, and examined ways to solve above‐mentioned difficulty by combining features.We evaluated Stylometry-based features, thesaurus-based features, modalities-based features, and their combination features on author identification task using Linear Discriminant Analysis, and then demonstrated the effectiveness of this approach.
キーワード(和) テキストマイニング / 特徴量 / 計量文献学
キーワード(英) Text mining / Features / Stylometry
資料番号 NLC2018-21
発行日 2018-08-30 (NLC)

研究会情報
研究会 NLC / IPSJ-DC
開催期間 2018/9/6(から2日開催)
開催地(和) 成蹊大学
開催地(英) Seikei University
テーマ(和) 第13回 テキストアナリティクス・シンポジウム
テーマ(英) The Thirteenth Text Analytics Symposium
委員長氏名(和) 榊 剛史(ホットリンク) / 大場 みち子(日立)
委員長氏名(英) Takeshi Sakaki(Hottolink) / Michiko Oba(Hitachi)
副委員長氏名(和) 吉田 光男(豊橋技科大) / 嶋田 和孝(九工大)
副委員長氏名(英) Mitsuo Yoshida(Toyohashi Univ. of Tech.) / Kazutaka Shimada(Kyushu Inst. of Tech.)
幹事氏名(和) 渡辺 靖彦(龍谷大) / 東中 竜一郎(NTT) / 菅沼 明(九大)
幹事氏名(英) Yasuhiko Watanabe(Ryukoku Univ.) / Ryuichiro Higashinaka(NTT) / Akira Suganuma(Kyushu Univ.)
幹事補佐氏名(和) 小早川 健(NHK) / 坂地 泰紀(東大)
幹事補佐氏名(英) Takeshi Kobayakawa(NHK) / Hiroki Sakaji(Univ. of Tokyo)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication / Special Interest Group on Document Communication
本文の言語 JPN
タイトル(和) 文学テキストの計量分析のための解釈に重点を置いた特徴量の検討
サブタイトル(和)
タイトル(英) Investigation of Features focusing on Interpretation for Metrical Analysis of Literary Text
サブタイトル(和)
キーワード(1)(和/英) テキストマイニング / Text mining
キーワード(2)(和/英) 特徴量 / Features
キーワード(3)(和/英) 計量文献学 / Stylometry
第 1 著者 氏名(和/英) 渡辺 隼 / Shun Watanabe
第 1 著者 所属(和/英) 東京都立産業技術高等専門学校(略称:都立産技高専)
Tokyo Metropolitan College of Industrial Technology(略称:TMCIT)
第 2 著者 氏名(和/英) 横井 健 / Takeru Yokoi
第 2 著者 所属(和/英) 東京都立産業技術高等専門学校(略称:都立産技高専)
Tokyo Metropolitan College of Industrial Technology(略称:TMCIT)
発表年月日 2018-09-07
資料番号 NLC2018-21
巻番号(vol) vol.118
号番号(no) NLC-210
ページ範囲 pp.79-84(NLC),
ページ数 6
発行日 2018-08-30 (NLC)