お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2008-02-21 11:00
二値化閾値の補正と罫線形状判定による罫線抽出の高精度化
田中 宏藤井勇作武部浩明藤本克仁富士通研PRMU2007-216
抄録 (和) 帳票画像から様々な種類の罫線を高精度に抽出する方式について述べる。近年の帳票OCRは、デジタルカメラの普及などに伴う帳票画像の多様化に対応するため、様々な帳票書式や画質に対しても高い帳票認識精度が求められている。我々は既に複雑な表構造に対応したセル抽出方式や、テクスチャ境界を含む帳票画像からの罫線抽出方式を開発してきたが、ノイズの重畳や画質劣化に対してもロバストな精度を実現するためには更なる改善が必要である。表認識誤りの大半を占める罫線抽出誤りは脱落誤りと付加誤りとに分類できるが、今回、それぞれの主な原因である罫線途切れと文字列からの罫線誤抽出を改善する技術を開発した。本稿では、先ず抽出したい罫線の条件を定義し、その条件を満たす罫線を抽出するために我々が採用したアプローチについて説明する。続いて罫線途切れを解消するための二値化閾値の補正について述べる。次に、先に定義した抽出罫線の条件を用いて罫線の形状を判定し、付加誤りを抑制する方法について述べる。最後にサンプル帳票画像を用いた評価を行い、本方式の効果と課題について考察する。 
(英) This paper describes enhancements of the ruled line extraction method using threshold correction and linearity evaluation. Recent form recognition applications are required to achieve high accuracy even with various styles of form images being much degraded. To meet the high-level demand, we have developed several methods which can suppress mis-recognition cases caused by failed or over extracted ruled lines. The proposed methods include correcting binarization thresholds and evaluating linearity of ruled lines. These methods are considered as an implementation of the ruled line model described briefly in the beginning of this paper. Details of our methods, performance evaluation results and discussions are presented.
キーワード (和) 帳票認識 / OCR / 罫線 / Niblack / 二値化 / 閾値 / /  
(英) Form Recognition / OCR / Ruled Line / Niblack / Binarization / Threshold / /  
文献情報 信学技報, vol. 107, no. 491, PRMU2007-216, pp. 13-18, 2008年2月.
資料番号 PRMU2007-216 
発行日 2008-02-14 (PRMU) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード PRMU2007-216

研究会情報
研究会 PRMU  
開催期間 2008-02-21 - 2008-02-22 
開催地(和) 筑波大学 
開催地(英) Univ. of Tsukuba 
テーマ(和) 文字・文書の認識・理解 
テーマ(英)  
講演論文情報の詳細
申込み研究会 PRMU 
会議コード 2008-02-PRMU 
本文の言語 日本語 
タイトル(和) 二値化閾値の補正と罫線形状判定による罫線抽出の高精度化 
サブタイトル(和)  
タイトル(英) Ruled Line Extraction Method using Corrective Thresholding and Linearity Evaluation 
サブタイトル(英)  
キーワード(1)(和/英) 帳票認識 / Form Recognition  
キーワード(2)(和/英) OCR / OCR  
キーワード(3)(和/英) 罫線 / Ruled Line  
キーワード(4)(和/英) Niblack / Niblack  
キーワード(5)(和/英) 二値化 / Binarization  
キーワード(6)(和/英) 閾値 / Threshold  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 田中 宏 / Hiroshi Tanaka / タナカ ヒロシ
第1著者 所属(和/英) (株)富士通研究所 (略称: 富士通研)
Fujitsu Laboratories Ltd. (略称: Fujitsu Labs.)
第2著者 氏名(和/英/ヨミ) 藤井 勇作 / Yusaku Fujii / フジイ ユウサク
第2著者 所属(和/英) (株)富士通研究所 (略称: 富士通研)
Fujitsu Laboratories Ltd. (略称: Fujitsu Labs.)
第3著者 氏名(和/英/ヨミ) 武部 浩明 / Hiroaki Takebe / タケベ ヒロアキ
第3著者 所属(和/英) (株)富士通研究所 (略称: 富士通研)
Fujitsu Laboratories Ltd. (略称: Fujitsu Labs.)
第4著者 氏名(和/英/ヨミ) 藤本 克仁 / Katsuhito Fujimoto / フジモト カツヒト
第4著者 所属(和/英) (株)富士通研究所 (略称: 富士通研)
Fujitsu Laboratories Ltd. (略称: Fujitsu Labs.)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2008-02-21 11:00:00 
発表時間 30分 
申込先研究会 PRMU 
資料番号 PRMU2007-216 
巻番号(vol) vol.107 
号番号(no) no.491 
ページ範囲 pp.13-18 
ページ数
発行日 2008-02-14 (PRMU) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会