講演名 2000/10/12
複合特徴を用いた情景画像からの文字領域抽出手法
高橋 裕樹, 葛西 浩一, 中嶋 正之,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では, ディジタルカメラで撮影した画像中に含まれる文字領域を抽出するアルゴリズムを提案する.画像中から文字領域を抽出する手法の研究は, 数多く行なわれているが, それらの研究の多くは, ある特定の一つの特徴のみを用いて文字領域の推定を行なっているため, 特徴を判別する際の条件の設定が困難であると言える.本報告では, 2つの特徴を用いることで, 比較的単純な条件のみを用いて文字領域の抽出を行なう手法を提案する.第一の特徴として輪郭画像から得られる閉輪郭線を利用する.第二の特徴として色を利用したクラスタリングによって, 領域分割を行なう.各特徴画像中の領域に対して, 各領域の幾何データの相対的な関係を用いて文字領域候補を選択する.最終的に輪郭特徴と色特徴から得られたそれぞれの文字領域候補の重複部分を文字領域として抽出する.最後に, 複数の画像に対して提案手法を用いた場合の文字列抽出結果の例と, 市販の文字認識ソフトウエアを用いて文字認識を行なった結果について示す.
抄録(英) This paper describes a method that extracts text regions from scenery images taken by digital camera. Many methods have been proposed for extraction of text regions from images. Most of them use a specific feature such as edge feature, color feature and so on. They, therefore, employ many conditions for extraction and it is also difficult to assign these parameters. This paper proposes an extraction method of text regions, which employs simple conditions, by using two kinds of features. One of them is edge feature which reflects local aspect of an image domain. Closed edges in an edge image are utilized for the extraction. The other feature is color distribution which reflects global aspect. Color clustering is employed for segmentation of images. In each feature image, candidates of character regions are selected based on relative geometric data among regions. Common regions of the selected one are extracted as character regions. Finally, these extracted regions are reconstructed as text regions. At the end of this paper, extracted text images from several scenery images and results of character recognition using a commercial software are shown.
キーワード(和)
キーワード(英)
資料番号 HCS2000-30
発行日

研究会情報
研究会 HCS
開催期間 2000/10/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Human Communication Science (HCS)
本文の言語 JPN
タイトル(和) 複合特徴を用いた情景画像からの文字領域抽出手法
サブタイトル(和)
タイトル(英) Extraction of text regions from scenery images based on multiple features
サブタイトル(和)
キーワード(1)(和/英)
第 1 著者 氏名(和/英) 高橋 裕樹 / Hiroki Takahashi
第 1 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Graduate School of Information Science & Engineering, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 葛西 浩一 / Kouichi Kasai
第 2 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Graduate School of Information Science & Engineering, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 中嶋 正之 / Masayuki Nakajima
第 3 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Graduate School of Information Science & Engineering, Tokyo Institute of Technology
発表年月日 2000/10/12
資料番号 HCS2000-30
巻番号(vol) vol.100
号番号(no) 375
ページ範囲 pp.-
ページ数 8
発行日