大会名称
2020年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2020
発行日
2020-08-18
セッション番号
6f
セッション名
文字・パターン認識
講演日
2020/09/03
講演場所(会議室等)
f
講演番号
H-036
タイトル
接続部分の特徴に着目したくずし字認識の一手法
著者名
一色昂祐小堀研一村木祐太
キーワード
くずし字
抄録
国文学研究資料館は平成26年度より,日本語の歴史的典籍を国際的に共同研究するために「日本語の歴史的典籍の国際共同研究ネットワーク構築計画」に取り組んでいる.しかし,日本語の歴史的典籍は「くずし字」(変体仮名と筆記体で書かれた文字)で書かれているため,その解読には専門的な知識と多大な時間と労力が必要となる.そのため,くずし字の自動翻刻が試みられている.本研究では,自動翻刻において障害となるつづけ字(繋がって書かれた文字)に着目し,くずし字特有の文字間のストロークの特徴を利用して文字を1文字に切り出し,畳み込みニューラルネットワーク(CNN)により識別することで自動翻刻を行う手法を提案する.
本文pdf
PDF download (462.7KB)