講演名 1994/11/18
Hough変換を用いた文書画像中の点線・飾り線の抽出
後藤 英昭, 阿曽 弘具,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 文書中の罫線やフィールドセパレータは,領域の分割を明確にするなど,文書構造に関する重要な情報を与える.本報告では,文書画像中の任意の罫線やフィールドセパレータを抽出する手法を示す.この手法では,罫線を構成する線素を抽出するためにHough変換を,罫線と文字を分離するために画像の自己相関関数を利用している.本手法により,実線はもちろん,点線や破線・鎖線,デザイン的側面の強いフィールドセパレータの抽出も可能となった.
抄録(英) The rules and the field-separators in document images make the partition of regions clear,and they often give useful "hints" about the document structure.This report describes an algorithm for extraction of arbitrary rules,lines and field-separators in document images.The local Hough transform is used for detecting line segments of the rules,and the auto-correlation function is used for separating lines and rules from character strings.The algorithm makes it possible to detect and extract,not only solid lines,but dotted lines,dashed lines or chain lines.Many kinds of decorated field-separators can also be extracted.
キーワード(和) 罫線抽出 / 点線抽出 / 文書構造 / Hough変換 / 自己相関関数
キーワード(英) rule extraction / dotted line extraction / document structure / Hough transform / auto-correlation function
資料番号 PRU94-67,HC94-66
発行日

研究会情報
研究会 PRU
開催期間 1994/11/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Understanding (PRU)
本文の言語 JPN
タイトル(和) Hough変換を用いた文書画像中の点線・飾り線の抽出
サブタイトル(和)
タイトル(英) An algorithm for extraction of dotted-line and designed-line using Hough transform
サブタイトル(和)
キーワード(1)(和/英) 罫線抽出 / rule extraction
キーワード(2)(和/英) 点線抽出 / dotted line extraction
キーワード(3)(和/英) 文書構造 / document structure
キーワード(4)(和/英) Hough変換 / Hough transform
キーワード(5)(和/英) 自己相関関数 / auto-correlation function
第 1 著者 氏名(和/英) 後藤 英昭 / Hideaki Goto
第 1 著者 所属(和/英) 東北大学工学部通信工学科
Department of Electrical Communications,Faculty of Engineering, Tohoku University
第 2 著者 氏名(和/英) 阿曽 弘具 / Hirotomo Aso
第 2 著者 所属(和/英) 東北大学工学部通信工学科
Department of Electrical Communications,Faculty of Engineering, Tohoku University
発表年月日 1994/11/18
資料番号 PRU94-67,HC94-66
巻番号(vol) vol.94
号番号(no) 340
ページ範囲 pp.-
ページ数 8
発行日