講演名 2002/5/10
情景画像からのハングル文字列領域抽出と字素識別
金 大祐, 高橋 裕樹, 中嶋 正之,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では,デジタルカメラで撮影した画像中のハングル文字領域の抽出,認識を行う手法について検討を行う.ハングル文字の構造特徴を利用し,輪郭特徴と色特徴から段階的にハングルを構成する字素を抽出することによって,情景画像からハングル文字列を抽出する手法を提案する.輪郭画像からは,ハングルの字素の構造の単純さを利用して,テクスチャやノイズを多く含む領域を削除し,字素としての形状の簡単な条件を用いて字素輪郭候補の抽出を行う.次に,字素輪郭候補に対する外接矩形を探索領域とする局所的な画像情報を用いて,字素を構成する領域である字素領域候補の抽出を行った後,文字列が同一の色から構成されているという特徴を用いて,色空間でのクラスタリングとハングルの字素の配置パターンによって文字列領域の抽出を行う.さらに,ハングルの字素の構造特徴を用いて,対象パターンの端点,交点の数と位置から字素を認識する手法を提案する.任意の条件で撮影した画像100枚に対して,ハングル文字列を抽出した結果,85.97%の文字抽出率が得られた.また,ハングルを構成する字素が連結していない理想的なハングルを対象に.字素認識を行った結果,71.96%の認識率が得られた.
抄録(英) The paper proposes a method which extracts Hangul regions and recognizes Hangul alphabets in images captured by a digital camera. The proposed method extracts candidates of Hangul alphabets from edge images by using the feature of Hangul structure. As a subsequent process, based on the Hangul structure and homochromaticity of an identical text, the Hangul regions are extracted by clustering procedure in color space. Texture regions and noise are excluded and Hangul alphabet regions are extracted from edge images by using simplicity of the Hangul structure. The extracted candidates are classified into character regions and background in color space. The clustering process is performed in circumscribed rectangles of extracted edges in the previous procedure. Moreover, the proposed method recognizes the extracted Hangul alphabets which are ideally written. It analyzes endpoints and intersected points of the extracted alphabet skeletons. The proposed method extracts 85.97% of Hangul text from 100 images captured on arbitrary conditions. Furthermore, 71.96% of alphabets are recognized for ideal Hangul of which Hangul alphabets are not connected each other in a character.
キーワード(和) ハングル文字列 / 文字列抽出 / 文字認識 / ディジタルカメラ
キーワード(英) Hangul text / Text extraction / Character recognition / Digital Camera
資料番号 MI2002-34
発行日

研究会情報
研究会 MI
開催期間 2002/5/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Medical Imaging (MI)
本文の言語 JPN
タイトル(和) 情景画像からのハングル文字列領域抽出と字素識別
サブタイトル(和)
タイトル(英) Extraction and Recogniton of Hangul from Scenery Images
サブタイトル(和)
キーワード(1)(和/英) ハングル文字列 / Hangul text
キーワード(2)(和/英) 文字列抽出 / Text extraction
キーワード(3)(和/英) 文字認識 / Character recognition
キーワード(4)(和/英) ディジタルカメラ / Digital Camera
第 1 著者 氏名(和/英) 金 大祐 / Daewoo KIM
第 1 著者 所属(和/英) 東京工業大学 大学院 情報理工学研究科
Graduate School of Information Science & Engineering, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 高橋 裕樹 / Hiroki TAKAHASHI
第 2 著者 所属(和/英) 東京工業大学 大学院 情報理工学研究科
Graduate School of Information Science & Engineering, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 中嶋 正之 / Masayuki NAKAJIMA
第 3 著者 所属(和/英) 東京工業大学 大学院 情報理工学研究科
Graduate School of Information Science & Engineering, Tokyo Institute of Technology
発表年月日 2002/5/10
資料番号 MI2002-34
巻番号(vol) vol.102
号番号(no) 57
ページ範囲 pp.-
ページ数 6
発行日