講演名 2019-03-01
情景内カラー文字認識のための最適2値化と変形耐性画像マッチング
鈴木 愼人(法政大), 若原 徹(法政大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では,情景内カラー文字認識のための最適2値化および変形耐性画像マッチングの適用を提案する.まず,カラー文字画像に対してLab色空間でK-meansクラスタリングを行い,複数の2値化候補画像を生成する.次いで,CNNを用いた2クラス分類で,複数の候補画像から最適な2値化画像を選択する.最後に,アフィン変換耐性を有するGAT相関法を用いたk-NN分類による認識を行う.提案手法を情景内文字画像データセット“The Chars74K”に適用し,最適2値化画像選択率96.6%,文字認識率73.9%を達成した.
抄録(英) This paper proposes an efficient combination of optimal binarization and distortion-tolerant image matching for color character recognition in scene images. First, we apply K-means clustering in Lab color space to a given color character image to generate a set of candidate binarized images. Second, those candidate binarized images are fed into the convolutional neural network in order to select an optimally binarized character image. Finally, the optimally binarized character image is recognized via affine-invariant image matching technique, GAT correlation, and k-nearest neighbor classification method. Experimental results made on the well-known color character dataset “The Chars74K” show that the proposed method achieves a correctly binarized character selection rate of 96.6%, and the final character recognition rate of 73.9%.
キーワード(和) 情景内カラー文字認識 / 最適2値化 / K-meansクラスタリング / GAT相関法
キーワード(英) Character Recognition in Scene Images / Optimal Binarization / K-means Clustering / GAT Correlation
資料番号 PRMU2018-130,CNR2018-53
発行日 2019-02-21 (PRMU, CNR)

研究会情報
研究会 PRMU / CNR
開催期間 2019/2/28(から2日開催)
開催地(和) 徳島大学
開催地(英)
テーマ(和) ロホ?ティクスとそれを支えるヒ?シ?ョン技術
テーマ(英)
委員長氏名(和) 佐藤 真一(NII) / 小野 哲雄(北大)
委員長氏名(英) Shinichi Sato(NII) / Tetsuo Ono(Hokkaido Univ.)
副委員長氏名(和) 井尻 善久(オムロン) / 玉木 徹(広島大) / 神原 誠之(奈良先端大) / 高汐 一紀(慶大)
副委員長氏名(英) Yoshihisa Ijiri(Omron) / Toru Tamaki(Hiroshima Univ.) / Masayuki Kanbara(NAIST) / Kazunori Takashio(Keio Univ.)
幹事氏名(和) 石井 雅人(NEC) / 菅野 裕介(阪大) / 坂本 大介(北大) / 吉岡 康介(パナソニック)
幹事氏名(英) Masato Ishii(NEC) / Yusuke Sugano(Osaka Univ.) / Daisuke Sakamoto(Hokkaido Univ.) / Kosuke Yoshioka(Panasonic)
幹事補佐氏名(和) 入江 豪(NTT) / 牛久 祥孝(東大) / 水戸 和(セコム) / 小林 優佳(東芝) / 石原 達也(NTT)
幹事補佐氏名(英) Go Irie(NTT) / Yoshitaka Ushiku(Univ. of Tokyo) / Wataru Mito(SECOM) / Yuka Kobayashi(Toshiba) / Tatsuya Ishihara(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Cloud Network Robotics
本文の言語 JPN
タイトル(和) 情景内カラー文字認識のための最適2値化と変形耐性画像マッチング
サブタイトル(和)
タイトル(英) Recognition of Color Characters in Scene Images via Optimal Binarization and Distortion-tolerant Image Matching
サブタイトル(和)
キーワード(1)(和/英) 情景内カラー文字認識 / Character Recognition in Scene Images
キーワード(2)(和/英) 最適2値化 / Optimal Binarization
キーワード(3)(和/英) K-meansクラスタリング / K-means Clustering
キーワード(4)(和/英) GAT相関法 / GAT Correlation
第 1 著者 氏名(和/英) 鈴木 愼人 / Masato Suzuki
第 1 著者 所属(和/英) 法政大学(略称:法政大)
Hosei University(略称:Hosei Univ.)
第 2 著者 氏名(和/英) 若原 徹 / Toru Wakahara
第 2 著者 所属(和/英) 法政大学(略称:法政大)
Hosei University(略称:Hosei Univ.)
発表年月日 2019-03-01
資料番号 PRMU2018-130,CNR2018-53
巻番号(vol) vol.118
号番号(no) PRMU-459,CNR-460
ページ範囲 pp.89-94(PRMU), pp.89-94(CNR),
ページ数 6
発行日 2019-02-21 (PRMU, CNR)