お知らせ 研究会の開催と会場に参加される皆様へのお願い(2020年10月開催~)
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2021-03-04 15:00
[ポスター講演]OCRのための書き込み済み印刷書類における手書きの要素と印刷文字の分離手法
櫻井亮太朗日置尋久京大EMM2020-73
抄録 (和) 書き込みが加えられた印刷書類にOCRを適用する際には、一般に前処理で手書き要素と印刷文字を分離しておくことが求められる。そこで本研究では、書き込み済みの印刷書類内で両者を分離する手法を検討した。提案手法では、手書き要素と印刷文字を判別、分離した後、両者が重なっていた箇所で印刷文字に生じる欠損をInpaintingとモルフォロジー変換によ り修復する。本研究では20枚の書き込み済み英語論文画像で実験を行い、印刷文字のOCR認識率で提案手法を評価した。その結果、書き込みのある文書ではOCR認識率が平均約60%であったのに対して、提案手法の適用後はOCR認識率が平均約95%まで向上した。 
(英) In applying OCR to documents with handwritings, printed texts and handwritings have to be separated from each other. We propose a separation method for this purpose. In our method, we first identify printed texts and handwritings in a document and separate them. We would then find the former is damaged by the latter where they intersect. We restore the printed texts through an Inpainting method and a morphological operation. We have evaluated our method by the OCR recognition rate of printed texts using twenty images of English papers with handwritings. The average OCR recognition rate has been improved from about 60% to 95% before and after applying our method.
キーワード (和) OCR / 文書画像 / 書き込み要素 / 画像修復 / / / /  
(英) OCR / Document Image / Handwritings / Image Inpainting / / / /  
文献情報 信学技報, vol. 120, no. 418, EMM2020-73, pp. 34-39, 2021年3月.
資料番号 EMM2020-73 
発行日 2021-02-25 (EMM) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EMM2020-73

研究会情報
研究会 EMM  
開催期間 2021-03-04 - 2021-03-05 
開催地(和) オンライン開催 
開催地(英) Online 
テーマ(和) 画質・音質評価,知覚・認知メトリクス,人間視聴覚システム,一般 
テーマ(英) Image and Sound Quality, Metrics for Perception and Recognition, Human Auditory and Visual System, etc. 
講演論文情報の詳細
申込み研究会 EMM 
会議コード 2021-03-EMM 
本文の言語 日本語 
タイトル(和) OCRのための書き込み済み印刷書類における手書きの要素と印刷文字の分離手法 
サブタイトル(和)  
タイトル(英) A Separation Method for Handwritings and Printed Texts on Documents as a Preprocessing Filter for OCR 
サブタイトル(英)  
キーワード(1)(和/英) OCR / OCR  
キーワード(2)(和/英) 文書画像 / Document Image  
キーワード(3)(和/英) 書き込み要素 / Handwritings  
キーワード(4)(和/英) 画像修復 / Image Inpainting  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 櫻井 亮太朗 / Ryotaro Sakurai / サクライ リョウタロウ
第1著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第2著者 氏名(和/英/ヨミ) 日置 尋久 / Hirohisa Hioki / ヒオキ ヒロヒサ
第2著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2021-03-04 15:00:00 
発表時間 15 
申込先研究会 EMM 
資料番号 IEICE-EMM2020-73 
巻番号(vol) IEICE-120 
号番号(no) no.418 
ページ範囲 pp.34-39 
ページ数 IEICE-6 
発行日 IEICE-EMM-2021-02-25 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会