講演名 2019-05-31
Proposal for Automatic Extraction Framework of Superconductors Related Information from Scientific Literature
Luca Foppiano(物質・材料研究機構), Thaer M. Dieb(物質・材料研究機構), Akira Suzuki(物質・材料研究機構), Masashi Ishii(物質・材料研究機構),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) The automatic collection of materials information from research papers using Natural Language Processing (NLP) is highly required for rapid materials development using big data, namely materials informatics (MI). The difficulty of this automatic collection is mainly caused by the variety of expressions in the papers, a robust system with tolerance to such variety is required to be developed. In this paper, we report an ongoing interdisciplinary work to construct a system for automatic collection of superconductor-related information from scientific literature using text mining techniques. We focused on the identification of superconducting material names and their critical temperature (Tc) key property. We discuss the construction of a prototype for extraction and linking using machine learning (ML) techniques for the physical information collection. From the evaluation using 500 sample documents, we define a baseline and a direction for future improvements.
抄録(英) The automatic collection of materials information from research papers using Natural Language Processing (NLP) is highly required for rapid materials development using big data, namely materials informatics (MI). The difficulty of this automatic collection is mainly caused by the variety of expressions in the papers, a robust system with tolerance to such variety is required to be developed. In this paper, we report an ongoing interdisciplinary work to construct a system for automatic collection of superconductor-related information from scientific literature using text mining techniques. We focused on the identification of superconducting material names and their critical temperature (Tc) key property. We discuss the construction of a prototype for extraction and linking using machine learning (ML) techniques for the physical information collection. From the evaluation using 500 sample documents, we define a baseline and a direction for future improvements.
キーワード(和) material informatics / superconductors / machine learning / nlp / tdm
キーワード(英) material informatics / superconductors / machine learning / nlp / tdm
資料番号 SC2019-1
発行日 2019-05-24 (SC)

研究会情報
研究会 SC
開催期間 2019/5/31(から2日開催)
開催地(和) 物質・材料研究機構(千現地区)
開催地(英) National Institute for Materials Science
テーマ(和) サイエンス・サービスプラットフォーム/データサービスと機械学習, 一般
テーマ(英) Science Service Platform, Data Service and Machine Learning, etc
委員長氏名(和) 中村 匡秀(神戸大)
委員長氏名(英) Masahide Nakamura(Kobe Univ.)
副委員長氏名(和) 菊地 伸治(物質・材料研究機構) / 山登 庸次(NTT)
副委員長氏名(英) Shinji Kikuchi(National Institute for Materials Science) / Yoji Yamato(NTT)
幹事氏名(和) 細野 繁(東京工科大学) / 木村 功作(富士通研)
幹事氏名(英) Shigeru Hosono(Tokyo University of Technology) / Kosaku Kimura(Fujitsu Lab.)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Technical Committee on Service Computing
本文の言語 ENG
タイトル(和)
サブタイトル(和)
タイトル(英) Proposal for Automatic Extraction Framework of Superconductors Related Information from Scientific Literature
サブタイトル(和)
キーワード(1)(和/英) material informatics / material informatics
キーワード(2)(和/英) superconductors / superconductors
キーワード(3)(和/英) machine learning / machine learning
キーワード(4)(和/英) nlp / nlp
キーワード(5)(和/英) tdm / tdm
第 1 著者 氏名(和/英) Luca Foppiano / Luca Foppiano
第 1 著者 所属(和/英) National Institute for Materials Science(略称:物質・材料研究機構)
National Institute for Materials Science(略称:NIMS)
第 2 著者 氏名(和/英) Thaer M. Dieb / Thaer M. Dieb
第 2 著者 所属(和/英) National Institute for Materials Science(略称:物質・材料研究機構)
National Institute for Materials Science(略称:NIMS)
第 3 著者 氏名(和/英) Akira Suzuki / Akira Suzuki
第 3 著者 所属(和/英) National Institute for Materials Science(略称:物質・材料研究機構)
National Institute for Materials Science(略称:NIMS)
第 4 著者 氏名(和/英) Masashi Ishii / Masashi Ishii
第 4 著者 所属(和/英) National Institute for Materials Science(略称:物質・材料研究機構)
National Institute for Materials Science(略称:NIMS)
発表年月日 2019-05-31
資料番号 SC2019-1
巻番号(vol) vol.119
号番号(no) SC-66
ページ範囲 pp.1-5(SC),
ページ数 5
発行日 2019-05-24 (SC)