講演名 2006-02-24
曲面に書かれた文字列の抽出と補正(テーマセッション(1), 文字認識・文書理解)
榛葉 武士, 竹内 義則, 松本 哲也, 工藤 博章, 大西 昇,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 曲面に書かれた文字は,斜め撮影により,直線的に書かれた文字列が湾曲してしまう.本稿では,このような湾曲文字列を抽出・補正する手法を提案する.提案手法では,文字列の一般的な特徴を利用して抽出を行う.まず,"文字とその背景の輝度差が高い","一つの文字列内で文字の色は同じ"という特徴より,エッジベースで局所的な2値化を行う.次に,"文字の大きさが等しい","文字の間隔が短い","局所的な直線性"という特徴から,領域を連結することで文字列を抽出する.次に,文字列の湾曲を2次多項式で近似し,文字列領域を求める.最後に求めた湾曲モデルを利用して,湾曲を直線的に補正する.実験により,斜め撮影によって湾曲した文字列でも抽出でき,その補正も良好な結果であることを確認した.また,抽出精度は平均適合率60.5%平均再現率62.7%となった.
抄録(英) A linear arrangement of characters on the curved surface is curved due to a slant viewing. This paper proposes a method to extract the curved character strings and to correct its distortion. The proposed method uses some general characteristics of a character string. First, we binarize an image based on edges using characteristics that there are high contrast in brightness between a characters and its background, and the color in a string is the same color. Second, we extract character strings by connecting regions using three characteristics: the size of a character is similar, the space between neighboring characters is short and characters are locally aligned. Third, we approximate the curved character string by the 2nd order polynomial and extract its area. Finally, by a curve model, we correct the curved character string to obtain a linear string. The experimental results show that the method can extract even curved strings and correct their distortion. The extraction accuracy is 60.5% of average precision and 62.7% of average recall.
キーワード(和) 曲面 / 湾曲文字列 / 文字抽出 / 文字列候補の延長
キーワード(英) curved surface / curved character string / character extraction / string candidate extension
資料番号 TL2005-69,PRMU2005-204
発行日

研究会情報
研究会 TL
開催期間 2006/2/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Thought and Language (TL)
本文の言語 JPN
タイトル(和) 曲面に書かれた文字列の抽出と補正(テーマセッション(1), 文字認識・文書理解)
サブタイトル(和)
タイトル(英) Extraction of character strings on a curved surface and correction of their distortion
サブタイトル(和)
キーワード(1)(和/英) 曲面 / curved surface
キーワード(2)(和/英) 湾曲文字列 / curved character string
キーワード(3)(和/英) 文字抽出 / character extraction
キーワード(4)(和/英) 文字列候補の延長 / string candidate extension
第 1 著者 氏名(和/英) 榛葉 武士 / Takeshi SHIMBA
第 1 著者 所属(和/英) 名古屋大学情報科学研究科・メディア科学専攻
Graduate school of Infomation Science, Nagoya University
第 2 著者 氏名(和/英) 竹内 義則 / Yoshinori TAKEUCHI
第 2 著者 所属(和/英) 名古屋大学情報セキュリティ対策推進室,理化学研究所バイオミメティックコントロール研究センター
Infomation Security Promotion Agency, Nagoya University, BMC Research Center
第 3 著者 氏名(和/英) 松本 哲也 / Tetsuya MATSUMOTO
第 3 著者 所属(和/英) 名古屋大学情報科学研究科・メディア科学専攻
Graduate school of Infomation Science, Nagoya University
第 4 著者 氏名(和/英) 工藤 博章 / Hiroaki KUDO
第 4 著者 所属(和/英) 名古屋大学情報科学研究科・メディア科学専攻
Graduate school of Infomation Science, Nagoya University
第 5 著者 氏名(和/英) 大西 昇 / Noboru OHNISHI
第 5 著者 所属(和/英) 名古屋大学情報科学研究科・メディア科学専攻
Graduate school of Infomation Science, Nagoya University
発表年月日 2006-02-24
資料番号 TL2005-69,PRMU2005-204
巻番号(vol) vol.105
号番号(no) 613
ページ範囲 pp.-
ページ数 6
発行日