大会名称 |
---|
2019年 総合大会 |
大会コ-ド |
2019G |
開催年 |
2019 |
発行日 |
2019-03-05 |
セッション番号 |
D-9 |
セッション名 |
ライフインテリジェンスとオフィス情報システム |
講演日 |
2019/03/21 |
講演場所(会議室等) |
54号館 303教室 |
講演番号 |
D-9-13 |
タイトル |
情報種別を活用したテキストデータ構造化手法の検討 |
著者名 |
○西村康孝, 吉原貴仁, |
キーワード |
情報抽出, テキストデータ, 構造化データ |
抄録 |
メールやSNSなどの非構造なテキストデータを,機械処理できる表データやデータベースなどのデータへ構造化することで,データ利活用が容易になる.テキストデータは日々大量に生成されており,人手に依らない自動的な構造化が課題である.従来Twitterのテキストデータからイベントの会期,開催場所などを抽出する手法がある.しかしながら,テキストデータに複数の日時・場所情報が含まれると,その中から会期と開催場所の情報を選択できない場合があった.そこで本稿では,情報種別を活用することで,抽出すべき日時・場所情報をより確かに選択する手法を検討する. |
本文pdf |
PDF download
|