講演名 2003/3/6
DPマッチングを用いた帳票枠構造照合方式
新庄 広, 高橋 寿一, 古川 直広,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 枠の位置や大きさが1枚ずつ微妙に異なる表形式帳票から,自動的に読取フィールドを抽出する方式を提案する。本方式は,帳票の枠構造を記述したモデルと,入力画像から検出した枠構造とをDPマッチングで照合することによりフィールドを抽出する。かすれやノイズを含む低品質な画像データから1枚あたり約43フィールドを抽出する実験を行なった結果,フィールド単位の抽出率が97. 7%,平均処理時間が188msec/枚であった。
抄録(英) This paper focuses on field identification in low-quality semi-fixed form images. The semi-fixed forms are same kind of form, but size and location of cells in forms are different by sheet. Therefore, location of fields cannot be defined precisely. The Identificatoin method has two features to achieve robustness. One is grid representation using several types of intersection and the terminal points of the frame lines. The other is the form structure analysis using DP matching. In an experiment, 98.3% of fields are identified correctly by this method, and the average processing time was 188msec.
キーワード(和) 枠構造照合 / DPマッチング / フィールド抽出 / 準定型帳票
キーワード(英) form structure analysis / Dynamic Programming matching / field identification / semi-fixed form
資料番号 PRMU2002-228
発行日

研究会情報
研究会 PRMU
開催期間 2003/3/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) DPマッチングを用いた帳票枠構造照合方式
サブタイトル(和)
タイトル(英) A Field Identification Method for Form Documents based on DP matching
サブタイトル(和)
キーワード(1)(和/英) 枠構造照合 / form structure analysis
キーワード(2)(和/英) DPマッチング / Dynamic Programming matching
キーワード(3)(和/英) フィールド抽出 / field identification
キーワード(4)(和/英) 準定型帳票 / semi-fixed form
第 1 著者 氏名(和/英) 新庄 広 / Hiroshi SHlNJO
第 1 著者 所属(和/英) (株)日立製作所中央研究所
Central Research Laboratory, Hitachi, Ltd.
第 2 著者 氏名(和/英) 高橋 寿一 / Toshikazu Takahashi
第 2 著者 所属(和/英) (株)日立製作所中央研究所
Central Research Laboratory, Hitachi, Ltd.
第 3 著者 氏名(和/英) 古川 直広 / Naohiro FURUKAWA
第 3 著者 所属(和/英) (株)日立製作所中央研究所
Central Research Laboratory, Hitachi, Ltd.
発表年月日 2003/3/6
資料番号 PRMU2002-228
巻番号(vol) vol.102
号番号(no) 707
ページ範囲 pp.-
ページ数 6
発行日