講演名 2017-02-10
業績推定とのマルチタスク学習による決算短信からの重要文抽出
磯沼 大(東大), 藤野 暢(東大), 浮田 純平(東大), 村上 遥(東大), 浅谷 公威(東大), 森 純一郎(東大), 坂田 一郎(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,記事生成などへの自動要約技術の適用が注目されている.本研究では決算短信を対象にした重要文抽出に取り組むが,決算短信への適用には参照要約不足という課題が有る.決算短信の参照要約として,一般にそれを要約し作成された決算記事の利用が考えられるが,決算記事は人手によって作成されるため十分な汎化性能を得るのに不足する場合が多い.一方で,ほぼ全ての決算短信には売上高・純利益などの業績に関する情報が付与されており,抽出されるべき重要文は業績を反映する文であることが多い.そこで本研究では,重要文抽出の学習に参照要約だけでなく,業績情報を用いる手法を提案する.具体的には,業績推定とのマルチタスク学習を導入し,業績を推定可能な文を抽出するように判別器の学習を行うことで,参照要約が少量の場合においても汎化性能が高い学習モデルを実現する.提案手法をLSTM-RNNに適用し,実際の決算短信と記事を用いた精度検証実験を行った結果,特に訓練データが少量の場合において精度が向上し,かつそれが業績推定の学習によりもたらされたことが確認された.
抄録(英) In this paper, we proposed a methodology of summarizing financial statements which contributes to high quality investment decision-making. In the task of supervised extractive summarization of financial statements, the lack of training data is crucial issue. To solve the issue, we propose a extractive summarization architecture using multi-task learning with financial results prediction. The sentences focused in financial results prediction correspond to the sentences that should be extracted, therefore the learning on financial results prediction contributes to the sentence extraction task. The experiment shows that our model improves the accuracy of summarization especially in the case of few training data.
キーワード(和) 重要文抽出 / 決算短信 / 業績推定 / マルチタスク学習 / リカレントニューラルネットワーク
キーワード(英) Sentence Extraction / Financial Report / Financial Results Prediction / Multi-Task Learning / Recurrent Neural Networks
資料番号 NLC2016-47
発行日 2017-02-02 (NLC)

研究会情報
研究会 NLC / IPSJ-IFAT
開催期間 2017/2/9(から2日開催)
開催地(和) 大阪・梅田 ティーオージー会議室
開催地(英)
テーマ(和) 第10回テキストマイニング・シンポジウム
テーマ(英)
委員長氏名(和) 金山 博(日本IBM)
委員長氏名(英) Hiroshi Kanayama(IBM)
副委員長氏名(和) 市瀬 眞(NTTドコモ) / 榊 剛史(東大/ホットリンク)
副委員長氏名(英) Makoto Ichise(NTT DoCoMo) / Takeshi Sakaki(Univ. of Tokyo/Hottolink)
幹事氏名(和) 渡辺 靖彦(龍谷大) / 嶋田 和孝(九工大)
幹事氏名(英) Yasuhiko Watanabe(Ryukoku Univ.) / Kazutaka Shimada(Kyushu Inst. of Tech.)
幹事補佐氏名(和) 東中 竜一郎(NTT) / 吉田 光男(豊橋技科大)
幹事補佐氏名(英) Ryuichiro Higashinaka(NTT) / Mitsuo Yoshida(Toyohashi Univ. of Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication / Special Interest Group on Information Fundamentals and Access Technologies
本文の言語 JPN
タイトル(和) 業績推定とのマルチタスク学習による決算短信からの重要文抽出
サブタイトル(和)
タイトル(英) Extractive Summarization of Financial Statement Using Multi-Task Learning
サブタイトル(和)
キーワード(1)(和/英) 重要文抽出 / Sentence Extraction
キーワード(2)(和/英) 決算短信 / Financial Report
キーワード(3)(和/英) 業績推定 / Financial Results Prediction
キーワード(4)(和/英) マルチタスク学習 / Multi-Task Learning
キーワード(5)(和/英) リカレントニューラルネットワーク / Recurrent Neural Networks
第 1 著者 氏名(和/英) 磯沼 大 / Masaru Isonuma
第 1 著者 所属(和/英) 東京大学(略称:東大)
University of Tokyo(略称:UTokyo)
第 2 著者 氏名(和/英) 藤野 暢 / Toru Fujino
第 2 著者 所属(和/英) 東京大学(略称:東大)
University of Tokyo(略称:UTokyo)
第 3 著者 氏名(和/英) 浮田 純平 / Jumpei Ukita
第 3 著者 所属(和/英) 東京大学(略称:東大)
University of Tokyo(略称:UTokyo)
第 4 著者 氏名(和/英) 村上 遥 / Haruka Murakami
第 4 著者 所属(和/英) 東京大学(略称:東大)
University of Tokyo(略称:UTokyo)
第 5 著者 氏名(和/英) 浅谷 公威 / Kimitaka Asatani
第 5 著者 所属(和/英) 東京大学(略称:東大)
University of Tokyo(略称:UTokyo)
第 6 著者 氏名(和/英) 森 純一郎 / Junichiro Mori
第 6 著者 所属(和/英) 東京大学(略称:東大)
University of Tokyo(略称:UTokyo)
第 7 著者 氏名(和/英) 坂田 一郎 / Ichiro Sakata
第 7 著者 所属(和/英) 東京大学(略称:東大)
University of Tokyo(略称:UTokyo)
発表年月日 2017-02-10
資料番号 NLC2016-47
巻番号(vol) vol.116
号番号(no) NLC-451
ページ範囲 pp.45-50(NLC),
ページ数 6
発行日 2017-02-02 (NLC)