講演名 2007-03-16
古文書解読用電子くずし字辞典を引くための手書き文字認識(テーマセッション6(オフライン処理),文字・文書の認識・理解)
小沼 元輝, 朱碧 蘭, 山田 奨治, 柴山 守, 中川 正樹,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,電子くずし字辞典に用いるロバストな文字認識の開発について述べる.古文書の翻刻作業を特定の専門家以外でも可能にし,その効率を高めるために,古文書で標準的に用いられるくずし字の辞典を電子化し,翻刻の利便性を向上させることが有効である.我々は,67,739種のくずし字に対する認識システムを開発した.くずし字までいかない通常の字体に対しても現有の認識システムを利用できるようにした.採用手法は,現在の文字パターンに対して一定の認識率を保証しているので,実用に耐えることを期待しているが,現実課題のサンプルパターンが少ないために,定量的な評価は今後の課題とする.
抄録(英) This paper presents robust recognition of cursive character patterns for accessing a digital dictionary to decode historical documents. In order to liberate the task of decoding historical documents from a very limited number of experts and make the task efficient, preparation of a digital dictionary of cursive styles of character patterns commonly used in historical documents is effective. We have implemented a cursive handwriting recognition system for 67,739 categories. Moreover, we made the existing recognition system available for recognizing less cursive handwritten character patterns. Since the employed technologies have been already established for current characters and handwritings, we expect the method to work for the above-mentioned our task. Sample patterns are not enough, however, so that performance evaluation is left for later studies.
キーワード(和) 古文書 / 電子辞書 / くずし字 / 文字認識 / オフライン認識 / オンライン認識
キーワード(英) Historical Document / Digital Dictionary / Cursive Character Pattern / Online Recognition / Offline Recognition
資料番号 PRMU2006-270
発行日

研究会情報
研究会 PRMU
開催期間 2007/3/9(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 古文書解読用電子くずし字辞典を引くための手書き文字認識(テーマセッション6(オフライン処理),文字・文書の認識・理解)
サブタイトル(和)
タイトル(英) Development of cursive character pattern recognition for accessing a digital dictionary to support decoding of historical documents
サブタイトル(和)
キーワード(1)(和/英) 古文書 / Historical Document
キーワード(2)(和/英) 電子辞書 / Digital Dictionary
キーワード(3)(和/英) くずし字 / Cursive Character Pattern
キーワード(4)(和/英) 文字認識 / Online Recognition
キーワード(5)(和/英) オフライン認識 / Offline Recognition
キーワード(6)(和/英) オンライン認識
第 1 著者 氏名(和/英) 小沼 元輝 / Motoki ONUMA
第 1 著者 所属(和/英) 東京農工大学工学府
Tokyo University Of Agriculture And Technology
第 2 著者 氏名(和/英) 朱碧 蘭 / Bilan ZHU
第 2 著者 所属(和/英) 東京農工大学工学府
Tokyo University Of Agriculture And Technology
第 3 著者 氏名(和/英) 山田 奨治 / Shoji YAMADA
第 3 著者 所属(和/英) 国際日本文化研究センター
International Research Center for Japanese Studies
第 4 著者 氏名(和/英) 柴山 守 / Mamoru SHIBAYAMA
第 4 著者 所属(和/英) 京都大学東南アジア研究所
Center for Southeast Asian Studies
第 5 著者 氏名(和/英) 中川 正樹 / Masaki NAKAGAWA
第 5 著者 所属(和/英) 東京農工大学工学府
Tokyo University Of Agriculture And Technology
発表年月日 2007-03-16
資料番号 PRMU2006-270
巻番号(vol) vol.106
号番号(no) 606
ページ範囲 pp.-
ページ数 6
発行日