講演名 2018-12-13
An attention-based encoder-decoder for recognizing Japanese historical document recognition
レ ドゥック アィン(NII), 持橋 大地(統計数理研), 増田 勝也(東大), 美馬 秀樹(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) attention model, encoder-decoder approach
抄録(英) Inspired by the recent successes of attention based encoder-decoder (AED) approach on image captioning, machine translation, we present an AED model as an end-to-end recognition system for recognizing Japanese historical document. The recognition system has two main modules: a dense convolution neural network for extracting multiscale features, and a Long Shor Term Memory (LSTM) decoder with attention model for generating target text. We can train the model end-to-end. The model requires only input text line images and corresponding output characters. Therefore, we don’t need the annotation in character level and save a lot of time for making annotations. The recognition system is trained by our annotated documents. We show the data imbalance problem in the current data and its effect on the performance of the recognition system through the experiments.
キーワード(英) Japanese historical documentattention modelencoder-decoder approach
資料番号 PRMU2018-78
発行日 2018-12-06 (PRMU)

研究会 PRMU
開催期間 2018/12/13(から2日開催)
開催地(和) 東北大学
テーマ(和) 深層学習とPRMU技術およひ?その応用
委員長氏名(和) 佐藤 真一(NII)
委員長氏名(英) Shinichi Sato(NII)
副委員長氏名(和) 井尻 善久(オムロン) / 玉木 徹(広島大)
副委員長氏名(英) Yoshihisa Ijiri(Omron) / Toru Tamaki(Hiroshima Univ.)
幹事氏名(和) 石井 雅人(NEC) / 菅野 裕介(阪大)
幹事氏名(英) Masato Ishii(NEC) / Yusuke Sugano(Osaka Univ.)
幹事補佐氏名(和) 入江 豪(NTT) / 牛久 祥孝(OSX)
幹事補佐氏名(英) Go Irie(NTT) / Yoshitaka Ushiku(OSX)

申込み研究会 Technical Committee on Pattern Recognition and Media Understanding
本文の言語 ENG
タイトル(英) An attention-based encoder-decoder for recognizing Japanese historical document recognition
キーワード(1)(和/英) / Japanese historical documentattention modelencoder-decoder approach
第 1 著者 氏名(和/英) レ ドゥック アィン / Le Duc Anh
第 1 著者 所属(和/英) 人文学オープンデータ共同利用センター(略称:NII)
The Center for Open Data in the Humanities(略称:CODH)
第 2 著者 氏名(和/英) 持橋 大地 / Mochihashi daichi
第 2 著者 所属(和/英) 統計数理研究所(略称:統計数理研)
The Institute of Statistical Mathematics(略称:ISM)
第 3 著者 氏名(和/英) 増田 勝也 / Masuda katsuya
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UT)
第 4 著者 氏名(和/英) 美馬 秀樹 / Mima Hideki
第 4 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UT)
発表年月日 2018-12-13
資料番号 PRMU2018-78
巻番号(vol) vol.118
号番号(no) PRMU-362
ページ範囲 pp.19-22(PRMU),
ページ数 4
発行日 2018-12-06 (PRMU)