講演名 2019-01-26
ニューラルネットワークを用いた図書の自動分類
杉山 治紀(鶴見大), 田辺 良則(鶴見大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 日本における図書などに付与される分類記号であるNDCを自動分類する研究において、機械学習法を適用した研究は多く存在する。しかし、ニューラルネットワークを用いた自動分類研究は少なく、それを用いた過去の研究でも、限られたカテゴリの分類であった。そこで本研究では、基本的な多層パーセプトロンのモデルから、応用モデルであるCNN、RNNを用いたニューラルネットワークを用いた図書の自動分類を行った。本研究では、実験データとしてインターネットショッピングモール「楽天市場」の書籍商品の書籍情報40,005件の書籍タイトル、商品情報、著者、出版者を用いた。また、ベクトル化にはJaccard 係数による特徴語の選定をした後、朝日新聞単語ベクトルを用いて書籍情報のベクトル化を行った。これらのモデルで図書の類までの自動分類を行った結果、多層パーセプトロンによるモデルで最大77%、CNNでは71%、RNNでは74%という結果となった。
抄録(英) There are many studies applying machine learning to classify books by the Nippon Decimal Classification (NDC), a system widely applied in Japan. However, few among them employ neural networks. In this paper, we report the experimental results of automatic classification of books using basic multilayer perceptron models, convolutional neural networks (CNN), and recurrent neural networks (RNN). We collected data of 40,005 books from internet shopping mall Rakuten Ichiba. They are book titles, merchandise information, author, and publisher. Feature words were selected using Jaccard coefficients and other factors after morphological analysis, and they were converted to word vectors using Asahi Shimbun Word Vector. Precisions obtained from experiments are: 77% by multi-layer perceptron models, 71% by CNN, and 74% by RNN.
キーワード(和) NDC / 機械学習 / 自動分類 / ニューラルネットワーク
キーワード(英) NDC / Machine Learning / Automatic classification / Neural Networks
資料番号 KBSE2018-53
発行日 2019-01-19 (KBSE)

研究会情報
研究会 KBSE
開催期間 2019/1/26(から1日開催)
開催地(和) 国立情報学研究所
開催地(英) NII
テーマ(和) 一般,学生セッション
テーマ(英)
委員長氏名(和) 粂野 文洋(日本工大)
委員長氏名(英) Fumihiro Kumeno(Nippon Inst. of Tech.)
副委員長氏名(和) 中川 博之(阪大)
副委員長氏名(英) Hiroyuki Nakagawa(Osaka Univ.)
幹事氏名(和) 猿渡 卓也(NTT) / 木村 功作(富士通研)
幹事氏名(英) Takuya Saruwatari(NTT) / Kosaku Kimura(Fujitsu labs.)
幹事補佐氏名(和) 高橋 竜一(茨城大) / 田辺 良則(鶴見大)
幹事補佐氏名(英) Ryuichi Takahashi(Ibaraki Univ.) / Yoshinori Tanabe(Tsurumi Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Knowledge-Based Software Engineering
本文の言語 JPN
タイトル(和) ニューラルネットワークを用いた図書の自動分類
サブタイトル(和)
タイトル(英) Automatic book classification using neural networks
サブタイトル(和)
キーワード(1)(和/英) NDC / NDC
キーワード(2)(和/英) 機械学習 / Machine Learning
キーワード(3)(和/英) 自動分類 / Automatic classification
キーワード(4)(和/英) ニューラルネットワーク / Neural Networks
第 1 著者 氏名(和/英) 杉山 治紀 / Haruki Sugiyama
第 1 著者 所属(和/英) 鶴見大学(略称:鶴見大)
Tsurumi University(略称:Tsurumi Univ.)
第 2 著者 氏名(和/英) 田辺 良則 / Yoshinori Tanabe
第 2 著者 所属(和/英) 鶴見大学(略称:鶴見大)
Tsurumi University(略称:Tsurumi Univ.)
発表年月日 2019-01-26
資料番号 KBSE2018-53
巻番号(vol) vol.118
号番号(no) KBSE-425
ページ範囲 pp.61-66(KBSE),
ページ数 6
発行日 2019-01-19 (KBSE)