講演名 2018-12-21
Bi-directional LSTM-CNN-CRFによる参考文献書誌情報抽出
浪越 大貴(岡山大), 太田 学(岡山大), 高須 淳宏(NII), 安達 淳(NII),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 膨大な文書が格納されている電子図書館の運用には,書誌情報データベースの整備が必須である.特に学術論文の参考文献欄には著者名やタイトルなどの有用な書誌情報が集約されているため,参考文献文字列から書誌情報を自動抽出する研究が行われている.本研究では,系列ラベリングタスクで高精度を達成しているBi-directional LSTM-CNN-CRF(BiLSTM-CNN-CRF)を拡張したモデルを用いて,参考文献文字列から書誌情報を抽出する.2雑誌の参考文献文字列から書誌情報を抽出する実験を行い,書誌情報抽出精度を評価した.
抄録(英) The effective use of digital libraries demands maintenance of bibliographic databases. Useful bibliographic information appears in the reference fields of academic papers, so much research has been to develop automatic extraction methods of bibliographic information from them. In this paper, we extract bibliographic information from reference strings using bi-directional LSTM-CNN-CRF (BiLSTM-CNN-CRF), which achieves high accuracy in sequence labeling tasks. We evaluated extraction accuracies by experiments where we extracted bibliographic information from the reference strings collected from two academic journals.
キーワード(和) 書誌情報抽出 / ニューラルネットワーク / BiLSTM-CNN-CRF / 参考文献文字列
キーワード(英) Bibliography Extraction / Neural Network / BiLSTM-CNN-CRF / Reference String
資料番号 DE2018-23
発行日 2018-12-14 (DE)

研究会情報
研究会 DE / IPSJ-DBS
開催期間 2018/12/21(から2日開催)
開催地(和) 国立情報学研究所(NII)
開催地(英) National Institute of Informatics
テーマ(和) データ工学・データベースシステムとエンターテイメントおよび一般
テーマ(英)
委員長氏名(和) 灘本 明代(甲南大) / 吉川 正俊(京大)
委員長氏名(英) Akiyo Nadamoto(Konan Univ.) / 吉川 正俊(京大)
副委員長氏名(和) 宮崎 純(東工大) / 大塚 真吾(神奈川工科大)
副委員長氏名(英) Jun Miyazaki(Tokyo Inst. of Tech.) / Shingo Otsuka(Kanagawa Inst. of Tech.)
幹事氏名(和) 大島 裕明(兵庫県立大) / 上田 真由美(流通科学大) / 天笠 俊之(筑波大)
幹事氏名(英) Hiroaki Ohshima(Univ. of Hyogo) / Mayuki Ueda(Univ. of Marketing and Distrbution Science) / 天笠 俊之(筑波大)
幹事補佐氏名(和) 合田 和生(東大) / 塩川 浩昭(筑波大)
幹事補佐氏名(英) Kazuo Goda(Univ. of Tokyo) / Hiroaki Shiokawa(Tsukuba Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Data Engineering / Special Interest Group on Database System
本文の言語 JPN
タイトル(和) Bi-directional LSTM-CNN-CRFによる参考文献書誌情報抽出
サブタイトル(和)
タイトル(英) Bibliography Extraction from Reference Strings by Bi-directional LSTM-CNN-CRF
サブタイトル(和)
キーワード(1)(和/英) 書誌情報抽出 / Bibliography Extraction
キーワード(2)(和/英) ニューラルネットワーク / Neural Network
キーワード(3)(和/英) BiLSTM-CNN-CRF / BiLSTM-CNN-CRF
キーワード(4)(和/英) 参考文献文字列 / Reference String
第 1 著者 氏名(和/英) 浪越 大貴 / Daiki Namikoshi
第 1 著者 所属(和/英) 岡山大学(略称:岡山大)
Okayama University(略称:Okayama Univ.)
第 2 著者 氏名(和/英) 太田 学 / Manabu Ohta
第 2 著者 所属(和/英) 岡山大学(略称:岡山大)
Okayama University(略称:Okayama Univ.)
第 3 著者 氏名(和/英) 高須 淳宏 / Atsuhiro Takasu
第 3 著者 所属(和/英) 国立情報学研究所(略称:NII)
National Institute of Informatics(略称:NII)
第 4 著者 氏名(和/英) 安達 淳 / Jun Adachi
第 4 著者 所属(和/英) 国立情報学研究所(略称:NII)
National Institute of Informatics(略称:NII)
発表年月日 2018-12-21
資料番号 DE2018-23
巻番号(vol) vol.118
号番号(no) DE-377
ページ範囲 pp.17-22(DE),
ページ数 6
発行日 2018-12-14 (DE)