講演名 2011-11-24
文字の切り出しを行わないテロップ文字列の高速な認識(テーマセッション,実世界文字認識と理解)
嶌田 聡, 長尾 慈郎, 東野 豪,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 映像中のテロップ文字は背景画像に重畳されることから,文字と背景との分離が困難な場合がある.一方,文字と背景を分離することなく画像の部分領域と辞書データとの照合を繰り返し行い文字の認識を行う方法は,計算コストが大きく処理時問がかかる.本稿では,テロップ文字列の性質として,文字の並び方の規則性や文字列に共通した文字特徴に着目し,画像全体を探索するのではなく,色エッジペアの線分上の密集度から文字らしいエリアを推定して探索範囲を限定すること,および,限定したエリア内の文字の特徴を認識することで文字の照合を効率よく行う方法を提案する.ニュース番組の放送映像を用いた実験を行い,ゴシック系の比較的大きく提示されたテロップであれば再現率,適合率とも80~90%の精度で,入力画像あたり0.5秒程度の処理時間で認識できることを確認した.
抄録(英) Telop characters may be difficult to separate from the background because they are superimposed on the background image. On the other hand, character recognition methods by matching partial areas of the image to dictionary data repeatedly without separating the text and background take much processing time because of their high computational cost. This paper proposes an efficient matching method focusing on regularity of the arrangement of characters and same common features of the telop characters. First, the telop area is estimated by using density of color edge pairs. And then, midline position, the height and font type of the telop are determined by recognizing one character in the estimated telop area. Finally, each character of telop is recognized by minimum matching process. Our experiments using relatively large Gothic type telops of news TV programs confirmed that the proposed method can recognize characters at the recall and precision rate of 80 to 90 percent and at the processing time of about 0.5 second per input image.
キーワード(和) 文字認識 / テロップ / 映像検索 / エッジペア
キーワード(英) character recognition / telop / video retrieval / edge pair
資料番号 PRMU2011-109
発行日

研究会情報
研究会 PRMU
開催期間 2011/11/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 文字の切り出しを行わないテロップ文字列の高速な認識(テーマセッション,実世界文字認識と理解)
サブタイトル(和)
タイトル(英) Fast telop character recognition without extracting character area
サブタイトル(和)
キーワード(1)(和/英) 文字認識 / character recognition
キーワード(2)(和/英) テロップ / telop
キーワード(3)(和/英) 映像検索 / video retrieval
キーワード(4)(和/英) エッジペア / edge pair
第 1 著者 氏名(和/英) 嶌田 聡 / Satoshi SHIMADA
第 1 著者 所属(和/英) 日本電信電話株式会社NTTサイバーソリューション研究所
NTT Cyber Solutions Laboratories
第 2 著者 氏名(和/英) 長尾 慈郎 / Jiro NAGAO
第 2 著者 所属(和/英) 日本電信電話株式会社NTTサイバーソリューション研究所:(現)NTTコミュニケーションズ
NTT Cyber Solutions Laboratories:(Present office)NTT Com
第 3 著者 氏名(和/英) 東野 豪 / Suguru HIGASHINO
第 3 著者 所属(和/英) 日本電信電話株式会社NTTサイバーソリューション研究所
NTT Cyber Solutions Laboratories
発表年月日 2011-11-24
資料番号 PRMU2011-109
巻番号(vol) vol.111
号番号(no) 317
ページ範囲 pp.-
ページ数 6
発行日