大会名称
2022年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2022
発行日
2022-08-30
セッション番号
7s
セッション名
情報システム(SC/LOIS)
講演日
2022/09/15
講演場所(会議室等)
11棟-22教室
講演番号
O-037
タイトル
ダークデータ抽出における弱教師学習でのラベリング関数推薦技術
著者名
加藤大羽田中 剛
キーワード
情報抽出, ダークデータ, 非構造データ, AI-OCR, 弱教師学習, ラベリング関数
抄録
生命保険会社では,年間13万件もの健康診断書をもとにした引受査定業務を100名程度の人的リソースを割いて手作業で工程管理システムに登録している。AI技術を取り入れた光学文字認識機能(AI-OCR)の導入で登録作業の手動工数削減が期待されるが,多様なフォーマットをAI-OCRに認識させる工数が膨大という課題を抱えている。そこで,健康診断書のような非定型なダークデータドキュメントについて,業務担当者の知見から特徴を特定し,機械的に処理可能なLabeling Function(LF)として蓄積,再活用するLF推薦技術を提案した。本発表では,LF推薦技術を用いて作成した弱教師学習によるデータ抽出AIを活用して,明細書や健康診断書からの情報抽出について述べる。
本文pdf
PDF download (547.4KB)