講演抄録/キーワード |
講演名 |
2021-09-16 10:00
深層学習を用いた離れているテキスト間の因果関係抽出 ○高 鵬挙・山崎智弘・伊藤雅弘(東芝) NLC2021-8 |
抄録 |
(和) |
これまでの因果関係抽出は手がかり表現などのパターンを用いる手法が多いが,パターンに当てはまらないものや離れたテキストに出現するものを抽出することが難しい。そこで本研究では,BERT の事前学習済みモデルを用いた深層学習によるアプローチを試みた。BERT は長すぎるテキストを扱えないため,BERT でセンテンスごとの特徴量を抽出したあとテキスト間の因果関係を抽出できるモデルを構築した。さらに,学習データのインバランス性を制御するため,文書のすべてのセンテンスを一度に入力するのではなく数センテンスずつのまとまりに分けて入力するようにした。その結果,離れたテキストの因果関係の抽出評価F値は0.400 から0.458 まで向上した。 |
(英) |
Most of the Existing methods for causal relationship extraction utilize patterns such as clue expressions, but it is difficult to extract between those that do not fit the pattern or separated texts. Therefore, in our study, we tried an approach using the pre-trained model BERT. To overcome BERT input length limitation, we used Transformer to extract the causal relationships between the texts features. In addition, for data augmentation and imbalance controlling, we generated input from subsets of sentences instead of whole document. As a result, the extraction evaluation F value of the causal relationship improved from 0.400 to 0.458. |
キーワード |
(和) |
因果関係 / 深層学習 / BERT / オーグメンテーション / / / / |
(英) |
Causal relationship / Deep learning / BERT / Data augmentation / / / / |
文献情報 |
信学技報, vol. 121, no. 178, NLC2021-8, pp. 11-16, 2021年9月. |
資料番号 |
NLC2021-8 |
発行日 |
2021-09-09 (NLC) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2021-8 |
研究会情報 |
研究会 |
NLC |
開催期間 |
2021-09-16 - 2021-09-16 |
開催地(和) |
オンライン開催 |
開催地(英) |
Online |
テーマ(和) |
第18回テキストアナリティクス・シンポジウム |
テーマ(英) |
The 18th Text Analytics Symposium |
講演論文情報の詳細 |
申込み研究会 |
NLC |
会議コード |
2021-09-NLC |
本文の言語 |
日本語 |
タイトル(和) |
深層学習を用いた離れているテキスト間の因果関係抽出 |
サブタイトル(和) |
|
タイトル(英) |
A causal relation extraction among distant texts using deep learning |
サブタイトル(英) |
|
キーワード(1)(和/英) |
因果関係 / Causal relationship |
キーワード(2)(和/英) |
深層学習 / Deep learning |
キーワード(3)(和/英) |
BERT / BERT |
キーワード(4)(和/英) |
オーグメンテーション / Data augmentation |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
高 鵬挙 / Pengju Gao / コウ ホウキョ |
第1著者 所属(和/英) |
(株)東芝 (略称: 東芝)
TOSHIBA Corporation (略称: TOSHIBA) |
第2著者 氏名(和/英/ヨミ) |
山崎 智弘 / Tomohiro Yamasaki / ヤマサキ トモヒロ |
第2著者 所属(和/英) |
(株)東芝 (略称: 東芝)
TOSHIBA Corporation (略称: TOSHIBA) |
第3著者 氏名(和/英/ヨミ) |
伊藤 雅弘 / Masahiro Ito / イトウ マサヒロ |
第3著者 所属(和/英) |
(株)東芝 (略称: 東芝)
TOSHIBA Corporation (略称: TOSHIBA) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2021-09-16 10:00:00 |
発表時間 |
25分 |
申込先研究会 |
NLC |
資料番号 |
NLC2021-8 |
巻番号(vol) |
vol.121 |
号番号(no) |
no.178 |
ページ範囲 |
pp.11-16 |
ページ数 |
6 |
発行日 |
2021-09-09 (NLC) |