講演名 1998/2/19
カラー文書画像中の文字領域抽出のための領域分割方式
長谷 博行, 丸山 博, 松下 靖征, 米田 政明, 酒井 充,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 文書メディア理解のひとつにグラビア、ポスターなどのカラー画像上の文字列を認識する問題がある。カラー画像中の文字を構成している画素は通常は単一色に見えるが、入力画像の色分布を測定すると、ある程度の広がりをもっていることが分かる。そこでまず、色空間でクラスタリングを行って色分割を行い、カラー画像の領域分割を考えるわけであるが、ここでクラスタリングの条件が問題となる。すなわち、クラスタ数が多すぎると、一つの文字が単一色にならない。またクラスタ数が少なすぎると背景と融合する現象が生じ、文字領域が正しく抽出できなくなる。本報告では、カラー画像上の文字領域を適切な単一色で分離抽出するための色空間分割法を検討する。まず、カラー画像中の文字領域の色分布から分布の広がり具合を調べる。次にある評価値を設定して、文字領域がクラスタリングによりどの程度良好に抽出できるかをクラスタ数を変えて求めた。また、そのクラスタ数における最小色差も調べた。これらの知見より、ヒストグラムに基づいた代表色選択法を検討した。最後に、クラスタリングによる方法と本代表色選択法の比較検討を行った。
抄録(英) It is very important that OCR systems can understand the character strings of a color document such as book covers or posters. In order to do this, we aim to extract character areas from a color document as the first step. Though we can see that the characters are of a single color, we can also recognize their color distribution by measurement. Consequently, we consider the desirable condition of color segmentation by clustering. However, too many clusters result in over-segmentation of a character color, while fewer clusters result in fusion with the background color. In this paper, we consider a segmentation method for the adequate extraction of character areas. We first observed the color distribution of a character area. And we also examined the extraction rate of a character area for the number of clusters. But the clustering is impractical for real time processing. So, we propose a simple algorithm for the extraction of representative colors. By using the algorithm, we can obtain adequate representative colors that depend on the input color image. Finally, we compared our method with the clustering method.
キーワード(和) カラー文書画像 / 文字領域 / クラスタリング / 領域分割 / 代表色
キーワード(英) color document / character area / clustering / segmentation / representative color
資料番号
発行日

研究会情報
研究会 PRMU
開催期間 1998/2/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) カラー文書画像中の文字領域抽出のための領域分割方式
サブタイトル(和)
タイトル(英) Color Segmentation to Extract Character Area from a Color Document
サブタイトル(和)
キーワード(1)(和/英) カラー文書画像 / color document
キーワード(2)(和/英) 文字領域 / character area
キーワード(3)(和/英) クラスタリング / clustering
キーワード(4)(和/英) 領域分割 / segmentation
キーワード(5)(和/英) 代表色 / representative color
第 1 著者 氏名(和/英) 長谷 博行 / Hiroyuki Hase
第 1 著者 所属(和/英) 富山大学工学部知能情報工学科
Intellectual Information Systems Engineering, Faculty of Engineering, Toyama University
第 2 著者 氏名(和/英) 丸山 博 / Hiroshi Maruyama
第 2 著者 所属(和/英) 富山大学工学部知能情報工学科
Intellectual Information Systems Engineering, Faculty of Engineering, Toyama University
第 3 著者 氏名(和/英) 松下 靖征 / Yasuyuki Matsushita
第 3 著者 所属(和/英) 富山大学工学部知能情報工学科
Intellectual Information Systems Engineering, Faculty of Engineering, Toyama University
第 4 著者 氏名(和/英) 米田 政明 / Masaaki Yoneda
第 4 著者 所属(和/英) 富山大学工学部知能情報工学科
Intellectual Information Systems Engineering, Faculty of Engineering, Toyama University
第 5 著者 氏名(和/英) 酒井 充 / Mitsuru Sakai
第 5 著者 所属(和/英) 富山大学工学部知能情報工学科
Intellectual Information Systems Engineering, Faculty of Engineering, Toyama University
発表年月日 1998/2/19
資料番号
巻番号(vol) vol.97
号番号(no) 558
ページ範囲 pp.-
ページ数 8
発行日