Filtered Channel Featuresの情景内文字認識への適用

粕谷 瑠衣; 大木 琢郎; 宮本 龍介

講演名	2016-03-11 Filtered Channel Featuresの情景内文字認識への適用粕谷瑠衣(明大), 大木琢郎(明大), 宮本龍介(明大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	情景内文字認識は近年の画像認識分野において注目を集めている挑戦的な課題の 1 つである.情景内文字認識を実現する手法としては,一般物体認識の技術を応用したウィンドウベースの手法が提案されているが,物体認識の技術を単純に文字認識に応用する場合,非常に多くのクラスを識別する識別器の構築が必要となり,処理速度と精度との両立が非常に困難な課題となっている.そこで我々は,まず始めに文字 · 非文字の二値分類を行うことで文字領域を検出し,検出された文字領域に対してのみマルチクラス識別を行うという,文字認識の処理を段階的に行う枠組みを提案した.しかし,この枠組みに不可欠な検出された文字領域に対してのマルチクラス識別はまだ実現されていない.そこで本稿では,近年の歩行者検出手法の一つで非常に高い精度を達成している Filtered Channel Features を用いてアルファベットを対象とするマルチクラス識別器の構築を行い,その性能評価を行った.データセットは学習用に ICDAR2013 を,評価用に合成画像をそれぞれ生成し使用した.評価の結果,提案手法は高い適合率を示すことができたが,再現率は適合率に比べ全体的に低く,他の手法との比較においても大きな改善は見られなかった.
抄録(英)	Scene Text Recognition is one of the most challenging task in the field of the image recognition, recently. Several kinds of window-based schemes have tried to improve the recognition accuracy but it is difficult to improvethe recognition accuracy without increasing processing cost when a multi-class classifier is used for this task. Con-sidering this problem, the authors have proposed a novel approach that consists of two kinds of opearations: textlocalization and text recognition. In the proposed approach, text regions are detected by a two-class classifier, and then, a multi-class classifier is applied to determined what characters are included in the detected regions. However, a multi-class classifier requried for our approach has not been constructed yet. Therefore, this paper aims to construct a multi-class classifier suitable for the proposed approach by applying the Filtered Channel Features for the training process of a multi-class classifier. Experimental results using the ICDAR2013 dataset and synthesized images created by the authors show that the precision becomes high but the recall are not improved drastically.
キーワード(和)	情景内文字認識 / Filtered Channel Features / 多クラス分類
キーワード(英)	scene text recognition / Filtered Channel Features / multi-class classification
資料番号	SIS2015-65
発行日	2016-03-03 (SIS)

研究会情報
研究会	SIS
開催期間	2016/3/10(から2日開催)
開催地（和）	東京都市大学世田谷キャンパス
開催地（英）	Tokyo City Univ.
テーマ（和）	ソフトコンピューティング，一般
テーマ（英）	Soft computing, etc.
委員長氏名（和）	棟安実治(関西大)
委員長氏名（英）	Mitsuji Muneyasu(Kansai Univ.)
副委員長氏名（和）	田中宏和(広島市大) / 仲地孝之(NTT)
副委員長氏名（英）	Hirokazu Tanaka(Hiroshima City Univ.) / Takayuki Nakachi(NTT)
幹事氏名（和）	田中豪(名古屋市大) / 原田康祐(東芝)
幹事氏名（英）	Go Tanaka(Nagoya City Univ.) / Kosuke Harada(Toshiba)
幹事補佐氏名（和）	辻裕之(神奈川工科大) / 田向権(九工大)
幹事補佐氏名（英）	Hiroyuki Tsuji(Kanagawa Inst. of Tech.) / Hakaru Tamukoh(Kyushu Inst. of Tech.)

講演論文情報詳細
申込み研究会	Technical Committee on Smart Info-Media System
本文の言語	JPN
タイトル（和）	Filtered Channel Featuresの情景内文字認識への適用
サブタイトル（和）
タイトル（英）	A Feasibility Study of Scene Text Recognition Based on Filtered Channel Features
サブタイトル（和）
キーワード(1)（和/英）	情景内文字認識 / scene text recognition
キーワード(2)（和/英）	Filtered Channel Features / Filtered Channel Features
キーワード(3)（和/英）	多クラス分類 / multi-class classification
第 1 著者氏名（和/英）	粕谷瑠衣 / Rui Kasuya
第 1 著者所属（和/英）	明治大学(略称：明大) Meiji University(略称：Meiji Univ.)
第 2 著者氏名（和/英）	大木琢郎 / Takuro Oki
第 2 著者所属（和/英）	明治大学(略称：明大) Meiji University(略称：Meiji Univ.)
第 3 著者氏名（和/英）	宮本龍介 / Ryusuke Miyamoto
第 3 著者所属（和/英）	明治大学(略称：明大) Meiji University(略称：Meiji Univ.)
発表年月日	2016-03-11
資料番号	SIS2015-65
巻番号（vol）	vol.115
号番号（no）	SIS-505
ページ範囲	pp.99-104(SIS),
ページ数	6
発行日	2016-03-03 (SIS)