講演名 2006-02-23
帳票読取りにおける印字ずれデータと読取り枠の対応付け方式(テーマセッション,文字認識・文書理解)
関 峰伸, 永崎 健, 丸川 勝美,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 帳票読取りにおいて,印字データがプレ印刷の枠から大きくはみ出して印字された場合でも高精度な読取りを実現するために,はみ出した印字データと読取り枠の対応付けを行う方式を開発した.本方式では,帳票内に複数存在する印字ずれデータの位置,ずれ方向,ずれ量を大局的かつ局所的に解析する.また,増加する処理時間を抑制するために,二値画像を用いて処理対象を絞込んだ後カラー画像処理を行う.実験の結果,はみ出した印字データの99.2%を正しく対応付けすることができた.
抄録(英) Optical character reader (OCR) technology for reading docume nts, such as monetary transaction documents, is becoming more and more important than ever before. The position of the printed character string is sometimes largely shifted from its designated position, and there may be two or more directions in spite of one sheet of paper. There are various causes, the performance of the printer, a mistake in the printing position designed by the software, a variation in the cell positions caused by the publishers and by the publishing dates, or even a mistake of the handw riting position. We developed a recognition method for determining which character strings are to be read in such difficult situations. Amethod for determining the correspondence of character strings to cells with a very high success ratio was developed. This method is based on local and global rules, and effective control of these rules. It was estimated to have a 99.2% success ratio using an experiment on 11,387 character strings.
キーワード(和) 帳票 / OCR / 印字ずれ / 印字データ / 読取り枠 / 対応付け
キーワード(英) Form / OCR / Alignment Error / Printing Position / Cell / Correspondence
資料番号 TL2005-51,PRMU2005-186
発行日

研究会情報
研究会 PRMU
開催期間 2006/2/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 帳票読取りにおける印字ずれデータと読取り枠の対応付け方式(テーマセッション,文字認識・文書理解)
サブタイトル(和)
タイトル(英) Recognition of Character Strings Printed with Large Alignment Error
サブタイトル(和)
キーワード(1)(和/英) 帳票 / Form
キーワード(2)(和/英) OCR / OCR
キーワード(3)(和/英) 印字ずれ / Alignment Error
キーワード(4)(和/英) 印字データ / Printing Position
キーワード(5)(和/英) 読取り枠 / Cell
キーワード(6)(和/英) 対応付け / Correspondence
第 1 著者 氏名(和/英) 関 峰伸 / Minenobu SEKI
第 1 著者 所属(和/英) (株)日立製作所 中央研究所
Hitachi, Ltd., Central Resarch Laboratory
第 2 著者 氏名(和/英) 永崎 健 / Takeshi NAGASAKI
第 2 著者 所属(和/英) (株)日立製作所 中央研究所
Hitachi, Ltd., Central Resarch Laboratory
第 3 著者 氏名(和/英) 丸川 勝美 / Katsumi MARUKAWA
第 3 著者 所属(和/英) (株)日立製作所 中央研究所
Hitachi, Ltd., Central Resarch Laboratory
発表年月日 2006-02-23
資料番号 TL2005-51,PRMU2005-186
巻番号(vol) vol.105
号番号(no) 614
ページ範囲 pp.-
ページ数 6
発行日