講演名 2018-12-13
情景内文字のCNNによる拡大
中村 俊貴(九大), 内田 誠一(九大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究は,畳み込みニューラルネットワーク (CNN) を用い,End-to-Endで情景画像内の文字を拡大することを目的とする.教師画像として重心を変えずに文字を拡大した画像を用い,畳み込み・逆畳み込み層から構成されるEncoder-Decoder型CNNにより学習を行った.さらに,文字拡大のタスクを文字隠蔽・文字抽出・文字拡大・画像合成の4つに分割し,それぞれに対する4つのCNNを学習しそれらを結合することで文字の拡大を行う手法を試みた.加えて,これら4つのCNNを結合し,重みを再利用するFine tuningを行ったCNNでも拡大を行った.また,これらの結果に対して,文字検出を用いた文字拡大手法との比較を行い,定量的に評価した.
抄録(英) The purpose of this research is magnifying scene texts using convolutional neural network (CNN) with end-to-end. We trained Encoder-Decoder type CNN composed of convolution/deconvolution using images magnified scene text without changing the center of gravity as teacher image. Also, we tried a method of magnifying scene texts by dividing the task into 4 of text erasing, text extraction, text magnifying, and image merging, and learning 4 CNNs for each, and combining them. Furthermore, we merging 1 CNN these 4 CNNs and fine tuned by reusing weights. In addition, we compare these results with text magnifying method using character detection and evaluated it quantitatively.
キーワード(和) 深層学習 / 情景内文字 / 文字拡大
キーワード(英)
資料番号 PRMU2018-76
発行日 2018-12-06 (PRMU)

研究会情報
研究会 PRMU
開催期間 2018/12/13(から2日開催)
開催地(和) 東北大学
開催地(英)
テーマ(和) 深層学習とPRMU技術およひ?その応用
テーマ(英)
委員長氏名(和) 佐藤 真一(NII)
委員長氏名(英) Shinichi Sato(NII)
副委員長氏名(和) 井尻 善久(オムロン) / 玉木 徹(広島大)
副委員長氏名(英) Yoshihisa Ijiri(Omron) / Toru Tamaki(Hiroshima Univ.)
幹事氏名(和) 石井 雅人(NEC) / 菅野 裕介(阪大)
幹事氏名(英) Masato Ishii(NEC) / Yusuke Sugano(Osaka Univ.)
幹事補佐氏名(和) 入江 豪(NTT) / 牛久 祥孝(OSX)
幹事補佐氏名(英) Go Irie(NTT) / Yoshitaka Ushiku(OSX)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding
本文の言語 JPN-ONLY
タイトル(和) 情景内文字のCNNによる拡大
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 深層学習
キーワード(2)(和/英) 情景内文字
キーワード(3)(和/英) 文字拡大
第 1 著者 氏名(和/英) 中村 俊貴 / Toshiki Nakamura
第 1 著者 所属(和/英) 九州大学(略称:九大)
Kyushu University(略称:Kyushu Univ.)
第 2 著者 氏名(和/英) 内田 誠一 / Seiichi Uchida
第 2 著者 所属(和/英) 九州大学(略称:九大)
Kyushu University(略称:Kyushu Univ.)
発表年月日 2018-12-13
資料番号 PRMU2018-76
巻番号(vol) vol.118
号番号(no) PRMU-362
ページ範囲 pp.7-12(PRMU),
ページ数 6
発行日 2018-12-06 (PRMU)