講演名 2021-03-04
書籍撮影時における湾曲文字列画像補正手法
土井 猛(神奈川工科大), 辻 裕之(神奈川工科大), 木村 誠聡(神奈川工科大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 書籍をデータ化する際に様々なスキャナやカメラが用いられているが, 最も簡便な手法としてはスマホカメラを用いることが行われている. しかしながら, スマホカメラなどの単眼カメラによる撮影では撮影した画像が湾曲する歪みが確認されている. これは綴じている文書に対し上部から撮影を行った場合に確認される現象で, 綴じた辺に向け湾曲した歪みが生じる. 本稿では筆者らが提案した一次の傾き補正を目的とするコーナー検出を用いた文字列傾き補正手法を拡張し, 書籍撮影時の湾曲した文字列歪みを補正する手法を提案する. 結果として主観評価においては88.35%の補正に成功した. また, Tesseract-OCRによる認識実験では提案手法を用いることで31.07%の認識成功率の文字列画像群が79.61%の認識成功率を示し提案法による有効性が確認できた.
抄録(英) Various scanners and cameras are used to convert documents into data. And using a smartphone is the simplest method. However, Document images shot of the smartphone camera with the single lens are curved. This distortion is when the bound document is shot from above. Curved distortion occurs toward the bound side. In this paper, we propose a method to correct a curved character string when shooting images of the bound document. It is based on the method of character string inclination correction using corner detection. Then, we confirm that the recognition rate of the proposed method was 79.61% which was higher than the recognition rate of 31.07% of the uncorrected data.
キーワード(和) 文字列補正 / 文書電子化 / 最小2乗法 / コーナー検出 / モルフォロジー / OCR
キーワード(英) String correction / Digitalization of Documents / Least squares / Corner detection / Morphology / OCR
資料番号 SIS2020-43
発行日 2021-02-25 (SIS)

研究会情報
研究会 SIS
開催期間 2021/3/4(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) ソフトコンピューティング,一般
テーマ(英) Soft Computing, etc.
委員長氏名(和) 末竹 規哲(山口大)
委員長氏名(英) Noriaki Suetake(Yamaguchi Univ.)
副委員長氏名(和) 木村 誠聡(神奈川工科大) / 笹岡 直人(鳥取大)
副委員長氏名(英) Tomoaki Kimura(Kanagawa Inst. of Tech.) / Naoto Sasaoka(Tottori Univ.)
幹事氏名(和) 古賀 崇了(近畿大) / 三澤 秀明(宇部高専)
幹事氏名(英) Takanori Koga(Kindai Univ.) / Hideaki Misawa(National Inst. of Tech., Ube College)
幹事補佐氏名(和) 坂東 幸浩(NTT) / 吉田 壮(関西大学)
幹事補佐氏名(英) Yukihiro Bandoh(NTT) / Soh Yoshida(Kansai Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Smart Info-Media Systems
本文の言語 JPN
タイトル(和) 書籍撮影時における湾曲文字列画像補正手法
サブタイトル(和)
タイトル(英) A Method of Curved Character String Correction of Folded Document Images
サブタイトル(和)
キーワード(1)(和/英) 文字列補正 / String correction
キーワード(2)(和/英) 文書電子化 / Digitalization of Documents
キーワード(3)(和/英) 最小2乗法 / Least squares
キーワード(4)(和/英) コーナー検出 / Corner detection
キーワード(5)(和/英) モルフォロジー / Morphology
キーワード(6)(和/英) OCR / OCR
第 1 著者 氏名(和/英) 土井 猛 / Takeru Doi
第 1 著者 所属(和/英) 神奈川工科大学(略称:神奈川工科大)
Kanagawa Institute of Technology(略称:KAIT)
第 2 著者 氏名(和/英) 辻 裕之 / Hiroyuki Tsuji
第 2 著者 所属(和/英) 神奈川工科大学(略称:神奈川工科大)
Kanagawa Institute of Technology(略称:KAIT)
第 3 著者 氏名(和/英) 木村 誠聡 / Tomoaki Kimura
第 3 著者 所属(和/英) 神奈川工科大学(略称:神奈川工科大)
Kanagawa Institute of Technology(略称:KAIT)
発表年月日 2021-03-04
資料番号 SIS2020-43
巻番号(vol) vol.120
号番号(no) SIS-415
ページ範囲 pp.45-48(SIS),
ページ数 4
発行日 2021-02-25 (SIS)