講演名 2012-09-02
画像編集により挿入されたテキスト領域の検出(一般セッション,コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
平野 廣美, 岡部 誠,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 画像編集ツールの充実により,誇大表現となるテキストが画像内に埋め込まれる例が増加している.大量の画像を扱うサイバーモール企業では重要な問題である.本論では,既存の画像に対して画像編集により埋め込まれたテキスト領域を検知するための新たな手法を提案する.従来から,OCRが文字のコード化を目的に,画像中のテキストを認識するための技術として使われてきたが,われわれの目的は,テキスト領域の有無に関し,前景(テキスト領域)と背景(それ以外)の2値分類を行うことである.テキスト領域では,コーナー特徴点が,水平,垂直,斜め方向に整列して現れるという観測結果から,整列単位をSupercornerと呼ぶ細長い短冊状にまとめ,そのSupercomerをノードとしたグラフを構成する.テキスト領域の特徴をノード間の関係重みとして与え,グラフカットを適用することで2値分類を実現した.また,文字サイズの多様性に対処するために多重解像度解析を用いている.その結果,任意に抽出した弊社サイト内の画像に対して,適合率66%,再現率86%で目的のテキスト領域特定ができた.
抄録(英) Traditionally, Optical Character Recognition (OCR) technologies have been applied to recognize texts embedded in an image. In order to conduct more precise recognition, the text area localization preprocessing has been proposed. Efficiently identifying text areas are inserted to an original image is an important task for e-commerce companies which handle numerous images. Generally, the text area localization is a computationally intensive process. We propose a novel approach to localize such text area efficiently as follows. First, local feature points (using FAST algorithm) that are closely positioned together on a near-straight line are grouped together, which is named as "Supercorner". Then a graph is created by connecting the centers of each supper corner and two terminal nodes added vertically to the image plane and each connecting cost is given as likelihood of the text area. By applying graph cut algorithm to this created graph allows separation of the text area from background. Here, to handle the diversity of font size, multi resolution analysis is also has been used. This technique achieved satisfactory results with 66% precision and 86% recall.
キーワード(和) OCR / Supercomer / 局所特徴量 / グラフカット / テキスト領域検知 / 多重解像度解析
キーワード(英) OCR / Supercorner / local feature / FAST / graph cut / text area localization / multi resolution analysis
資料番号 PRMU2012-37,IBISML2012-20
発行日

研究会情報
研究会 PRMU
開催期間 2012/8/26(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 画像編集により挿入されたテキスト領域の検出(一般セッション,コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
サブタイトル(和)
タイトル(英) Detection of Text Area Inserted by Image Editing
サブタイトル(和)
キーワード(1)(和/英) OCR / OCR
キーワード(2)(和/英) Supercomer / Supercorner
キーワード(3)(和/英) 局所特徴量 / local feature
キーワード(4)(和/英) グラフカット / FAST
キーワード(5)(和/英) テキスト領域検知 / graph cut
キーワード(6)(和/英) 多重解像度解析 / text area localization
第 1 著者 氏名(和/英) 平野 廣美 / Hiromi HIRANO
第 1 著者 所属(和/英) 楽天株式会社楽天技術研究所
Rakuten Inc. Rakuten Intitute of Technology
第 2 著者 氏名(和/英) 岡部 誠 / Makoto OKABE
第 2 著者 所属(和/英) 電気通信大学/JSTさきがけ
The University ofElectro-Communications/JSTPRESTO
発表年月日 2012-09-02
資料番号 PRMU2012-37,IBISML2012-20
巻番号(vol) vol.112
号番号(no) 197
ページ範囲 pp.-
ページ数 8
発行日