大会名称
2019年 総合大会
大会コ-ド
2019G
開催年
2019
発行日
2019-03-05
セッション番号
D-9
セッション名
ライフインテリジェンスとオフィス情報システム
講演日
2019/03/21
講演場所(会議室等)
54号館 303教室
講演番号
D-9-13
タイトル
情報種別を活用したテキストデータ構造化手法の検討
著者名
○西村康孝吉原貴仁
キーワード
情報抽出, テキストデータ, 構造化データ
抄録
メールやSNSなどの非構造なテキストデータを,機械処理できる表データやデータベースなどのデータへ構造化することで,データ利活用が容易になる.テキストデータは日々大量に生成されており,人手に依らない自動的な構造化が課題である.従来Twitterのテキストデータからイベントの会期,開催場所などを抽出する手法がある.しかしながら,テキストデータに複数の日時・場所情報が含まれると,その中から会期と開催場所の情報を選択できない場合があった.そこで本稿では,情報種別を活用することで,抽出すべき日時・場所情報をより確かに選択する手法を検討する.
本文pdf
PDF download   

PayPerView