講演名 2018-06-17
文章内容特定における語出現頻度情報の効果
奥村 雄輝(阪電通大), 森安 淳史(阪電通大), 廣川 佐千男(九大), 竹内 和広(阪電通大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 特定の語の出現情報が文章分類に役立つことは良く知られる. 本稿では,機能語や内容語といった語の分類にこだわらず,その出現情報だけではなく, 文書中の出現回数まで考慮した素性を使った文章分類を検討する. このような文章分類素性の検討により,特定の専門概念を記述する文章をより精緻に抽出することを狙う. 具体的な実験として,日本語Wikipedaの「アルゴリズムの解説」と思われる文を正例として, SVMによる特定文章判定を行う.実験の結果は,特定概念を記述する文体を主眼に分析した結果を紹介する.
抄録(英) Occurrence information of specific words is known as useful features for text classification. In this paper, we consider text classification using features that represent the number of occurrences in the text. Through such text classification, we aim to define more detailed feature to identify the texts that contain specific description of special concepts. For the purpose, we conduct an experiment using SVM to identify the texts that explain algorithms from the articles in Japanese Wikipedia. we analyze the results from the viewpoint of the writing style describing the specific concept.
キーワード(和) SVM / 文章分類 / 項頻度情報 / 属性選択
キーワード(英) SVM / Sentence classification / term frequency information / attribute selection
資料番号 TL2018-10
発行日 2018-06-10 (TL)

研究会情報
研究会 TL
開催期間 2018/6/17(から1日開催)
開催地(和) 神戸学院大学ポートアイランドキャンパス
開催地(英) Kobe Gakuin University (Port Island Campus)
テーマ(和) 『時間経過の認知と表現』・『言語の教育・言語と教育』・『思考と言語一般』
テーマ(英) "Cognition in Passage of Time and their Expression","Language Education, Language and Education,"Language and Thought"
委員長氏名(和) 佐野 洋(東京外国語大)
委員長氏名(英) Hiroshi Sano(Tokyo Univ. of Foreign Studies)
副委員長氏名(和) 近藤 公久(工学院大) / 竹内 和広(阪電通大)
副委員長氏名(英) Tadahisa Kondo(Kogakuin Univ.) / Kazuhiro Takeuchi(Osaka Electro-Comm. Univ.)
幹事氏名(和) 森下 美和(神戸学院大) / 坪田 康(京都工繊大)
幹事氏名(英) Miwa Morishita(Kobe Gakuin Univ.) / Yasushi Tsubota(Kyoto Inst. of Tech.)
幹事補佐氏名(和) 神長 伸幸(早大) / 高田 明典(フェリス女学院大) / 石川 彰夫(KDDI総合研究所)
幹事補佐氏名(英) Nobuyuki Jincho(Waseda Univ.) / Akinori Takada(Ferris Univ.) / Akio Ishikawa(KDDI Research)

講演論文情報詳細
申込み研究会 Technical Committee on Thought and Language
本文の言語 JPN
タイトル(和) 文章内容特定における語出現頻度情報の効果
サブタイトル(和)
タイトル(英) Effect of specifying the number of word occurrence in identification of specific text description
サブタイトル(和)
キーワード(1)(和/英) SVM / SVM
キーワード(2)(和/英) 文章分類 / Sentence classification
キーワード(3)(和/英) 項頻度情報 / term frequency information
キーワード(4)(和/英) 属性選択 / attribute selection
第 1 著者 氏名(和/英) 奥村 雄輝 / Yuki Okumura
第 1 著者 所属(和/英) 大阪電気通信大学(略称:阪電通大)
Osaka Electro-Communication University(略称:OECU)
第 2 著者 氏名(和/英) 森安 淳史 / Atsushi Moriyasu
第 2 著者 所属(和/英) 大阪電気通信大学(略称:阪電通大)
Osaka Electro-Communication University(略称:OECU)
第 3 著者 氏名(和/英) 廣川 佐千男 / Sachio Hirokawa
第 3 著者 所属(和/英) 九州大学(略称:九大)
Kyusyu University(略称:Kyusyu Univ.)
第 4 著者 氏名(和/英) 竹内 和広 / Kazuhiro Takeuchi
第 4 著者 所属(和/英) 大阪電気通信大学(略称:阪電通大)
Osaka Electro-Communication University(略称:OECU)
発表年月日 2018-06-17
資料番号 TL2018-10
巻番号(vol) vol.118
号番号(no) TL-99
ページ範囲 pp.53-56(TL),
ページ数 4
発行日 2018-06-10 (TL)