講演抄録/キーワード |
講演名 |
2015-09-11 09:55
条件付き確率場を用いた新聞報道からの未来予測情報抽出 ○島岡聖世・佐藤祥多・佐々木 彬・稲田和明(東北大)・関根 聡(ランゲージ・クラフト)・乾 健太郎(東北大) NLC2015-29 |
抄録 |
(和) |
「国連によれば、2025年段階で、世界の水使用量は00年比で30%以上増えることが確実と言われている。」– このような調査会社や行政機関などが発表する未来予測は、多くの人々にとって価値ある情報であり、新聞記事などから人手で収集・整理されてきた。しかし、膨大なテキスト情報から人手で未来情報を抽出することは、多大なコストがかかる。そこで、本研究では機械学習を用いて未来予測を自動的に抽出する方法を提案する。まず、機械学習に用いる訓練データとして、92本の新聞記事の各文に対して未来予測であるか否かのラベルを付与し、さらに未来予測の発表者名、発表日付なども同定したコーパスを作成した。そして、作成 したコーパスを用いて学習を行い、10分割交差検定を実施したところ、文単位での未来予測の抽出の精度は 0.836、再現率は 0.770 となった。 |
(英) |
(Advance abstract in Japanese is available) |
キーワード |
(和) |
情報抽出 / テキストマイニング / 条件付き確率場 / 自然言語処理 / / / / |
(英) |
Information Extraction / Conditional Random Field / / / / / / |
文献情報 |
信学技報, vol. 115, no. 222, NLC2015-29, pp. 57-62, 2015年9月. |
資料番号 |
NLC2015-29 |
発行日 |
2015-09-03 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2015-29 |