大会名称 |
---|
2022年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2022 |
発行日 |
2022-08-30 |
セッション番号 |
7s |
セッション名 |
情報システム(SC/LOIS) |
講演日 |
2022/09/15 |
講演場所(会議室等) |
11棟-22教室 |
講演番号 |
O-037 |
タイトル |
ダークデータ抽出における弱教師学習でのラベリング関数推薦技術 |
著者名 |
加藤大羽, 田中 剛, |
キーワード |
情報抽出, ダークデータ, 非構造データ, AI-OCR, 弱教師学習, ラベリング関数 |
抄録 |
生命保険会社では,年間13万件もの健康診断書をもとにした引受査定業務を100名程度の人的リソースを割いて手作業で工程管理システムに登録している。AI技術を取り入れた光学文字認識機能(AI-OCR)の導入で登録作業の手動工数削減が期待されるが,多様なフォーマットをAI-OCRに認識させる工数が膨大という課題を抱えている。そこで,健康診断書のような非定型なダークデータドキュメントについて,業務担当者の知見から特徴を特定し,機械的に処理可能なLabeling Function(LF)として蓄積,再活用するLF推薦技術を提案した。本発表では,LF推薦技術を用いて作成した弱教師学習によるデータ抽出AIを活用して,明細書や健康診断書からの情報抽出について述べる。 |
本文pdf |
PDF download (547.4KB) |