講演抄録/キーワード |
講演名 |
2008-02-22 13:15
テロップ文字パターン抽出の一検討 ○勝山 裕(富士通研)・白 洪亮(FRDC)・武部浩明・藤本克仁(富士通研) PRMU2007-239 |
抄録 |
(和) |
大量に録画されたTV番組の効率的な検索方法としてテロップ文字情報を使用する方法が有効である.テロップ文字認識では,テロップ出現区間,領域を求め,そこから文字パターンを抽出し認識を行う.本報告は,この中の文字パターン抽出に関する.テロップ領域について,表示区間の平均画像を色クラスタリングして色分解画像を生成する.マルチフレーム情報等でノイズを削除後,文字認識結果を使用して正しい文字パターン行を抽出する.その中からキー文字を求め,それを中心に文字候補矩形の集合を複数個生成し,認識結果の距離値情報と文字間隔情報を使用して正しい組合せを選択しノイズを除去した文字パターンを生成する.ニュース番組から取得した83テロップについて,文字矩形の角座標で評価を行い,再現率93.3%,適合率91.6%を達成した. |
(英) |
It is effective to use caption text to search a video from many recorded videos. For caption recognition, it needs to detect caption area and duration, to extract caption character patterns, and to recognize them. This paper reports about caption character patterns extraction. After generating average image of caption duration, color clustering is done to extract decomposed binary images. Then, noise is removed by multi-frame information. The most reliable character line is selected by its OCR result. Some key characters are extracted and combinations of characters are made based on them. The most reliable one is selected by result of character recognition and distance between adjacent characters. We evaluated accuracy using character box coordinates for 83 captions in a news video and got 93.3% recall and 91.6% precision rate. |
キーワード |
(和) |
テロップ / 文字認識 / 色クラスタリング / ノイズ除去 / マルチフレーム / / / |
(英) |
Caption / Charecter Recognition / Color Clustering / Noise Removal / Multi Frame / / / |
文献情報 |
信学技報, vol. 107, no. 491, PRMU2007-239, pp. 143-148, 2008年2月. |
資料番号 |
PRMU2007-239 |
発行日 |
2008-02-14 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2007-239 |