講演抄録/キーワード |
講演名 |
2020-12-21 14:30
構文情報と辞書情報を特徴量に用いたBi-LSTM-CRFによる医学論文からの未知用語の発見 ○吉田恭輔・湯本高行(兵庫県立大)・金子周司(京大)・礒川悌次郎・松井伸之・上浦尚武(兵庫県立大) DE2020-19 |
抄録 |
(和) |
近年,医療や生命科学分野の急速な進歩により,大量の論文が出版されており,それに伴い新たな病名などが専門用語として新たに出現している.専門用語は分野の概念を端的に表しており,その自動抽出は新たな概念を理解する上で重要な役割を持つ.そこで本研究では,LSTM を拡張したモデルであるBi-LSTM-CRF に,構文情報と辞専門用語書の情報を特徴量として入力することで,専門用語の特徴を学習し,医学論文から未知用語を抽出する手法を提案する. |
(英) |
|
キーワード |
(和) |
固有表現抽出 / 系列ラベリング / サブワード / 構文木情報 / / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 120, no. 305, DE2020-19, pp. 13-18, 2020年12月. |
資料番号 |
DE2020-19 |
発行日 |
2020-12-14 (DE) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
DE2020-19 |