講演抄録/キーワード |
講演名 |
2008-02-22 13:45
カラー情景画像からの文字抽出高精度化の一検討 ○若林昌格・白井啓一郎・岡本正行・山本博章(信州大) PRMU2007-240 |
抄録 |
(和) |
本稿では,カラー情景画像からの文字抽出において,できるだけ背景や文字の出現に制限を置かないロバストな手法について考察している.我々は以前,色空間上でのクラスタリングによる文字と背景の分離,さらにSVMによる文字と背景の識別を行って文字を抽出する手法を提案してきたが,複雑な背景上に配置されたり,シェーディングの影響により文字色が変化したりしている場合は,文字の抽出性能が十分ではなかった.この主な原因は画像全体に対してクラスタリングを行った場合,文字色と背景色が近かったり,文字列の占める領域が画像サイズに比べて小さい場合には,文字色と背景色とが同じクラスタに分類され,文字と背景が分離されないことである.これを改善するため,以前の手法でも,まずエッジに基づき画像を大まかなブロックに分割し,各ブロックに対してクラスタリングを行う手法を提案してきた.しかしながらこのブロック分割では,背景のエッジが強い場合,文字列のエッジと結合して望ましいブロック分割が行われない場合が多く見られた.本稿ではエッジによる領域分割を行う際に,エッジの強度だけでなくエッジ上の色情報を用いて,背景と文字領域を分離する手法について述べる.この結果,以前の手法に比べて文字領域の推定精度が上がり,結果として文字抽出性能も向上させることができた.実験ではICDAR 2003 Text Locating Competitionで用いられた251枚のカラー情景画像について文字抽出を行ない,本手法の有効性を確認している. |
(英) |
This paper describes a robust method for extracting character strings from scene images.In our previous method, character patterns and the background ones are separated by clustering on the color space, then they are classified into character and background by SVM (Support Vector Machine). The extraction performance was not enough for the images where characters are arranged on a complex background, or the character color has changed by the influence of shading. The main reason of this is as follows.Clustering for a whole image region sometimes fails to separate the character color from the background color when their colors are similar or the size of character pattern is very small compared with the size of background pattern. To improve the clustering performance, previous method first divides the image into a rough block based on the edge, and applies clustering for each block. But in this block segmentation, when the background edges are very intense and connected to character edges, preferable block segmentation often can not be done.This paper describes a block segmentation method by using not only magnitude of the edge but also using color information on the edge. This method improves accuracy of the block segmentation, and as a result the performance of character extraction.Proposed method was tested with 251 images from ICDAR 2003 Text Locating Competition, and the effectiveness of this method is confirmed. |
キーワード |
(和) |
文字抽出 / クラスタリング / SVM / / / / / |
(英) |
character extraction / clustering / SVM / / / / / |
文献情報 |
信学技報, vol. 107, no. 491, PRMU2007-240, pp. 149-154, 2008年2月. |
資料番号 |
PRMU2007-240 |
発行日 |
2008-02-14 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2007-240 |