講演名 | 2019-03-08 多様なレイアウトの帳票からのデータ抽出・反映のための項目名と項目値の自動関連付け手法 高木 郁子(NTT), 小笠原 志朗(NTT), 辻 幸嗣(NTT), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 帳票上の項目値の記載位置が変動した状況においても、所望の項目値の記載位置を特定・抽出可能とするために、キーバリュー形式の帳票に対して、帳票上の項目名・項目値の記載位置から項目名欄と項目値欄を自動的に関連付ける手法を検討する。 本稿では、配置上関連付く可能性の有無等、多くの帳票で成立している、欄同士の関連性に関する一般的な規則性を、制約条件や評価関数として表し、組合せ最適化問題に帰着して項目名欄と項目値欄の関連性の有無を求める手法を提案するとともに、ネットワークサービスで利用している実帳票に対して提案手法を適用した結果について報告する。 |
抄録(英) | In order to find data field values in forms of various key-value type formats, we propose a model to relate between data field values and their names by their position of field. The model is designed as combinatorial optimization to obtain optimal solutions that relates between data fields and their names in combination of fields that can be related by positions. In this paper, we report this method, algorithm for obtaining strict solution, and the result of experiment that evaluated this method for forms using in network services. |
キーワード(和) | 帳票 / 半構造データ / 自動化 / 組合せ最適化問題 |
キーワード(英) | Form / Semi-structured Data / Office Automation / Combinatorial Optimization |
資料番号 | ICM2018-65 |
発行日 | 2019-02-28 (ICM) |
研究会情報 | |
研究会 | ICM |
---|---|
開催期間 | 2019/3/7(から2日開催) |
開催地(和) | 久米島イーフ情報プラザ |
開催地(英) | |
テーマ(和) | エレメント管理,管理機能,理論・運用方法論,および一般 |
テーマ(英) | |
委員長氏名(和) | 吉原 貴仁(KDDI総合研究所) |
委員長氏名(英) | Kiyohito Yoshihara(KDDI Research) |
副委員長氏名(和) | 山下 陽一(NTTネオメイト) / 三好 匠(芝浦工大) |
副委員長氏名(英) | Yoichi Yamashita(NTT-Neomait) / Takumi Miyoshi(Shibaura Inst. of Tech.) |
幹事氏名(和) | 服部 雅晴(KDDI総合研究所) / 大石 晴夫(NTT) |
幹事氏名(英) | Masaharu Hattori(KDDI Research) / Haruo Ooishi(NTT) |
幹事補佐氏名(和) | 朱 韵成(日立) |
幹事補佐氏名(英) | Yunchen Zhu(Hitachi) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Information and Communication Management |
---|---|
本文の言語 | JPN |
タイトル(和) | 多様なレイアウトの帳票からのデータ抽出・反映のための項目名と項目値の自動関連付け手法 |
サブタイトル(和) | |
タイトル(英) | Finding data field values and their names in forms for automatically processing data in forms of various formats |
サブタイトル(和) | |
キーワード(1)(和/英) | 帳票 / Form |
キーワード(2)(和/英) | 半構造データ / Semi-structured Data |
キーワード(3)(和/英) | 自動化 / Office Automation |
キーワード(4)(和/英) | 組合せ最適化問題 / Combinatorial Optimization |
第 1 著者 氏名(和/英) | 高木 郁子 / Ikuko Takagi |
第 1 著者 所属(和/英) | 日本電信電話株式会社(略称:NTT) Nippon Telegraph and Telephone Corporation(略称:former NTT) |
第 2 著者 氏名(和/英) | 小笠原 志朗 / Shiro Ogasawara |
第 2 著者 所属(和/英) | 日本電信電話株式会社(略称:NTT) Nippon Telegraph and Telephone Corporation(略称:former NTT) |
第 3 著者 氏名(和/英) | 辻 幸嗣 / Kohji Tsuji |
第 3 著者 所属(和/英) | 日本電信電話株式会社(略称:NTT) Nippon Telegraph and Telephone Corporation(略称:former NTT) |
発表年月日 | 2019-03-08 |
資料番号 | ICM2018-65 |
巻番号(vol) | vol.118 |
号番号(no) | ICM-483 |
ページ範囲 | pp.89-94(ICM), |
ページ数 | 6 |
発行日 | 2019-02-28 (ICM) |