講演名 | 2006-02-23 帳票読取りにおける印字ずれデータと読取り枠の対応付け方式(テーマセッション,文字認識・文書理解) 関 峰伸, 永崎 健, 丸川 勝美, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 帳票読取りにおいて,印字データがプレ印刷の枠から大きくはみ出して印字された場合でも高精度な読取りを実現するために,はみ出した印字データと読取り枠の対応付けを行う方式を開発した.本方式では,帳票内に複数存在する印字ずれデータの位置,ずれ方向,ずれ量を大局的かつ局所的に解析する.また,増加する処理時間を抑制するために,二値画像を用いて処理対象を絞込んだ後カラー画像処理を行う.実験の結果,はみ出した印字データの99.2%を正しく対応付けすることができた. |
抄録(英) | Optical character reader (OCR) technology for reading docume nts, such as monetary transaction documents, is becoming more and more important than ever before. The position of the printed character string is sometimes largely shifted from its designated position, and there may be two or more directions in spite of one sheet of paper. There are various causes, the performance of the printer, a mistake in the printing position designed by the software, a variation in the cell positions caused by the publishers and by the publishing dates, or even a mistake of the handw riting position. We developed a recognition method for determining which character strings are to be read in such difficult situations. Amethod for determining the correspondence of character strings to cells with a very high success ratio was developed. This method is based on local and global rules, and effective control of these rules. It was estimated to have a 99.2% success ratio using an experiment on 11,387 character strings. |
キーワード(和) | 帳票 / OCR / 印字ずれ / 印字データ / 読取り枠 / 対応付け |
キーワード(英) | Form / OCR / Alignment Error / Printing Position / Cell / Correspondence |
資料番号 | TL2005-51,PRMU2005-186 |
発行日 |
研究会情報 | |
研究会 | PRMU |
---|---|
開催期間 | 2006/2/16(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Pattern Recognition and Media Understanding (PRMU) |
---|---|
本文の言語 | JPN |
タイトル(和) | 帳票読取りにおける印字ずれデータと読取り枠の対応付け方式(テーマセッション,文字認識・文書理解) |
サブタイトル(和) | |
タイトル(英) | Recognition of Character Strings Printed with Large Alignment Error |
サブタイトル(和) | |
キーワード(1)(和/英) | 帳票 / Form |
キーワード(2)(和/英) | OCR / OCR |
キーワード(3)(和/英) | 印字ずれ / Alignment Error |
キーワード(4)(和/英) | 印字データ / Printing Position |
キーワード(5)(和/英) | 読取り枠 / Cell |
キーワード(6)(和/英) | 対応付け / Correspondence |
第 1 著者 氏名(和/英) | 関 峰伸 / Minenobu SEKI |
第 1 著者 所属(和/英) | (株)日立製作所 中央研究所 Hitachi, Ltd., Central Resarch Laboratory |
第 2 著者 氏名(和/英) | 永崎 健 / Takeshi NAGASAKI |
第 2 著者 所属(和/英) | (株)日立製作所 中央研究所 Hitachi, Ltd., Central Resarch Laboratory |
第 3 著者 氏名(和/英) | 丸川 勝美 / Katsumi MARUKAWA |
第 3 著者 所属(和/英) | (株)日立製作所 中央研究所 Hitachi, Ltd., Central Resarch Laboratory |
発表年月日 | 2006-02-23 |
資料番号 | TL2005-51,PRMU2005-186 |
巻番号(vol) | vol.105 |
号番号(no) | 614 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |