講演名 2011-03-10
複雑背最中の多色テロップの認識方式の検討(テーマセッション,文字・文書の認識と理解)
勝山 裕, 桂 天宜, 皆川 明洋, 堀田 悦伸,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 映像中の複雑背景上の多色文字列の認識手法を提案する.大量に録画されたTV番組の効率的な検索方法としてテロップ文字情報を使用する方法が挙げられる.テロップ文字認識では,テロップ領域と出現区間を求め,求めた領域内部から文字パターンを抽出し認識を行う.従来は,複雑な背景や複数の文字色が使用されるテロップの文字パターン抽出が困難であったため,背景の一様性や文字色に対する制約を設ける必要があった.本報告では,この制約を緩和するための一方式として,カラーテロップ画像を色によって分解し,各色分解画像上に現れる文字候補から文字列を再構成する方式を提案する.文字列の再構成では,各分解画像で得られた文字候補に対する文字認識確信度,文字の並びの連続性,色の連続性をコストとしたDynamic Programming (DP)法によって文字列を構成する文字を選択する.複雑背景上の一行多色文字列の文字認識評価で,従来の一行同一色に対応したテロップ認識技術よりも認識再現率で大幅な向上を実現した.
抄録(英) We propose a caption recognition method for multi-color characters on complex background. Caption characters are used for an efficient search on a large amount of recorded TV programs. In the caption character recognition, the caption appearance section and the area is extracted, the character patterns are extracted from the area, and recognized. This paper focuses on caption character patterns extraction and recognition for multi-color characters on complex background that conventional methods are difficult to recognize them. The proposed method extracts decomposed binary images from input color caption image by color clustering. Then character candidates that are composed of combination of connect components are extracted by using recognized certainty. Finally, characters are selected by beyond-color Dynamic Programming method in which weight on recognition certainty, character alignment, and continuity of color are used. In the character recognition evaluation of one-line multi-color character string on a complex background, a great improvement was achieved from a conventional technique that can recognize only one-color characters on complex background image.
キーワード(和) 多色テロップ / 文字認識 / 色クラスタリング
キーワード(英) Multi-Color Caption / Character Recognition / Color Clustering
資料番号 PRMU2010-247
発行日

研究会情報
研究会 PRMU
開催期間 2011/3/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 複雑背最中の多色テロップの認識方式の検討(テーマセッション,文字・文書の認識と理解)
サブタイトル(和)
タイトル(英) A Study on Caption Recognition for Multi-Color Characters on Complex Background
サブタイトル(和)
キーワード(1)(和/英) 多色テロップ / Multi-Color Caption
キーワード(2)(和/英) 文字認識 / Character Recognition
キーワード(3)(和/英) 色クラスタリング / Color Clustering
第 1 著者 氏名(和/英) 勝山 裕 / Yutaka KATSUYAMA
第 1 著者 所属(和/英) (株)富士通研究所ソフト&ソリ研究所言語・メディア研究部
Software and Solution Laboratories, Language & Media Laboratory, FUJITSU LABORATORIES LTD.
第 2 著者 氏名(和/英) 桂 天宜 / Tianyi GUI
第 2 著者 所属(和/英) / (株)富士通研究所ソフト&ソリ研究所言語・メディア研究部
Fujitsu Research and Development Center Co., Ltd.
第 3 著者 氏名(和/英) 皆川 明洋 / Akihiro MINAGAWA
第 3 著者 所属(和/英) (株)富士通研究所ソフト&ソリ研究所言語・メディア研究部
Software and Solution Laboratories, Language & Media Laboratory, FUJITSU LABORATORIES LTD.
第 4 著者 氏名(和/英) 堀田 悦伸 / Yoshinobu HOTTA
第 4 著者 所属(和/英)
Software and Solution Laboratories, Language & Media Laboratory, FUJITSU LABORATORIES LTD.
発表年月日 2011-03-10
資料番号 PRMU2010-247
巻番号(vol) vol.110
号番号(no) 467
ページ範囲 pp.-
ページ数 6
発行日