講演名 2007-03-15
平行測地線からの形状復元によるデジカメ文書画像の歪み補正(テーマセッション3(文字画像処理2),文字・文書の認識・理解)
藤本 克仁, 武部 浩明, 諏訪 美佐子, 直井 聡,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 分厚い本や浮きのある帳票をデジタルカメラにより撮像した文書画像の歪み補正は、カメラベースの文書画像認識技術の重要な課題である。本論文では、「平行測地線からの形状復元」という新たな枠組みによる歪み補正方式を提案する。本方式は、滑らかに変形した紙面曲面を線織面によりモデル化し、伸ばした紙面中の文字列や表罫線が曲がった紙面上の平行な測地線になる事を活用して線織面を推定する。本方式の流れは、まず、入力した歪みのある画像から測地線の透視射影を抽出し、次に、平行測地線の性質を利用して連続DP等の最適化手法により線織面を構成する線織線の透視射影を推定し、さらに、数値微分・数値積分により測地線の高さを推定して紙面を表す線織面を特定し、高精度な歪み補正を実現する。本方式の詳細と有効性確認のための評価実験について報告する。
抄録(英) Methods to rectify distortion of digital camera document images of curved papers have become important for camera-based document image recognition. In this paper we propose a novel distortion rectification method based on "shape from parallel geodesics." This method considers the following features: parallel lines corresponding to character strings or ruled lines of tables on extended surface become parallel geodesics on a curved paper surface and a smoothly curved paper can be modeled by a ruled surface, that is, a sweep surface of rulings. The projected geodesics and the projected rulings exist in the input image derived from perspective transformation. The presented method extracts the projected geodesics, estimates the projected rulings in the input image, estimates the ruled surface that models the curved paper, and generates the corrected image, in this order. Continuous dynamic programming is used for the estimation of the projected rulings by the condition derived from parallelism of geodesics on the curved paper. It can estimate the ruled surface model directly by numerical operations of differentiation, integration and matrix inversion without any iterative calculation. We also report on experiments that show the effectiveness of the proposed method.
キーワード(和) 歪み補正 / 文書画像 / デジタルカメラ画像 / 平行測地線 / 形状復元
キーワード(英) distorted image rectification / document images / digital camera images / shape from parallel geodesics
資料番号 PRMU2006-252
発行日

研究会情報
研究会 PRMU
開催期間 2007/3/8(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 平行測地線からの形状復元によるデジカメ文書画像の歪み補正(テーマセッション3(文字画像処理2),文字・文書の認識・理解)
サブタイトル(和)
タイトル(英) A Study of Rectification of Digital Camera Document Image using Shape from Parallel Geodesics
サブタイトル(和)
キーワード(1)(和/英) 歪み補正 / distorted image rectification
キーワード(2)(和/英) 文書画像 / document images
キーワード(3)(和/英) デジタルカメラ画像 / digital camera images
キーワード(4)(和/英) 平行測地線 / shape from parallel geodesics
キーワード(5)(和/英) 形状復元
第 1 著者 氏名(和/英) 藤本 克仁 / Katsuhito Fujimoto
第 1 著者 所属(和/英) (株)富士通研究所
Fujitsu Laboratories Ltd.
第 2 著者 氏名(和/英) 武部 浩明 / Hiroaki Takebe
第 2 著者 所属(和/英) (株)富士通研究所
Fujitsu Laboratories Ltd.
第 3 著者 氏名(和/英) 諏訪 美佐子 / Misako Suwa
第 3 著者 所属(和/英) (株)富士通研究所
Fujitsu Laboratories Ltd.
第 4 著者 氏名(和/英) 直井 聡 / Satoshi Naoi
第 4 著者 所属(和/英) (株)富士通研究所
Fujitsu Laboratories Ltd.
発表年月日 2007-03-15
資料番号 PRMU2006-252
巻番号(vol) vol.106
号番号(no) 605
ページ範囲 pp.-
ページ数 6
発行日