講演名 2011-01-21
ハフ変換を利用した手書き文字領域と活字領域の判別法の提案(MR/ARの実用化に向けたCV/PR技術の課題と展望)
今野 裕也, 廣瀬 明,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 文書の電子化が一般的に普及し,次段階として,電子化された文書の自動管理方法が求められてきている.管理の自動化には,文書中文字画像のテキスト化や重要語抽出を行うことが必要だが,電子化された文書には手書き文字と活字が混在しているケースが多く,既存のOptical Haracter Reader(OCR)を利用しただけで実現することは困難である.この問題は,手書き文字と活字を判別することで解決可能である.この判別方法として,本提案は,手書きに起因する揺らぎを利用し,手書き文字領域と活字領域を判別する手法を提案する.本手法は,ハフ変換により文字を構成する線分情報を抽出し,線分の角度情報分布傾向を特徴量とすることで,手書きによる揺らぎを取得するものである.実際に,手書き文字,活字のサンプルを用意し,本手法を適用したところ,手書き文字と活字の角度情報の分布傾向に違いがあることを確認し,判別を実現可能であることを示すことができた.
抄録(英) Since digitalization of documents has been widespread nowadays, a method to automatically manage digitalized documents is required for the next stage. To realize this, it is necessary to perform character coding of text images and detect keywords. In many cases, however, since both handwritten and typed characters exist on digitalized documents, it is difficult to perform character coding and detect keywords using Optical Character Reader(OCR). This issue can be solved by identifying handwritten and typed characters. This report proposes the solution for this issue through a method of identifying the area of handwritten characters and that of typed characters using fluctuation in handwritten characters. This method obtains fluctuation by extracting line segments that form characters by using Hough transform and by quantifying the distribution tendency in the angles domain. We prepared samples of handwritten and typed characters and applied this method. As a result we confirmed that there is difference in the distribution tendency of the angles of line segments in handwritten and typed characters, which leads to the possibility to identify handwritten and typed characters.
キーワード(和) 手書き / 活字 / ハフ変換 / 文書領域判別 / 光学文字読取装置(OCR)
キーワード(英) handwritten character / printed character / Hough transform / text region classification / optical character reader
資料番号 PRMU2010-176,MVE2010-101
発行日

研究会情報
研究会 MVE
開催期間 2011/1/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Media Experience and Virtual Environment (MVE)
本文の言語 JPN
タイトル(和) ハフ変換を利用した手書き文字領域と活字領域の判別法の提案(MR/ARの実用化に向けたCV/PR技術の課題と展望)
サブタイトル(和)
タイトル(英) Proposal of a method to distinguish between handwritten and machine-printed character regions using Hough transform
サブタイトル(和)
キーワード(1)(和/英) 手書き / handwritten character
キーワード(2)(和/英) 活字 / printed character
キーワード(3)(和/英) ハフ変換 / Hough transform
キーワード(4)(和/英) 文書領域判別 / text region classification
キーワード(5)(和/英) 光学文字読取装置(OCR) / optical character reader
第 1 著者 氏名(和/英) 今野 裕也 / Yuuya KONNO
第 1 著者 所属(和/英) 富士ゼロックス株式会社
Fuji Xerox Co., Ltd.
第 2 著者 氏名(和/英) 廣瀬 明 / Akira HIROSE
第 2 著者 所属(和/英) 東京大学大学院工学系研究科電気系工学専攻
Department of Electrical Engineering and Information Systems, The University of Tokyo
発表年月日 2011-01-21
資料番号 PRMU2010-176,MVE2010-101
巻番号(vol) vol.110
号番号(no) 382
ページ範囲 pp.-
ページ数 6
発行日