講演抄録/キーワード |
講演名 |
2011-03-11 09:30
OCRソフトOCRopusへの数式認識モジュールの組込みの検討 ○山崎慎平・古郡史啓・趙 勤政・白井啓一郎・岡本正行(信州大) PRMU2010-267 |
抄録 |
(和) |
本研究では,オープンソースのOCRソフトであるOCRopusに数式認識モジュールを組込み,数式を含む文書画像認識システムの構築を目的としている.OCRopusは広範囲の文書電子化を目指した,モジュール性,拡張性,再利用性に優れた実験的なOCRシステムである.OCRopusは,前処理,レイアウト解析,テキストライン認識等の機能をモジュールとして持っており,数式認識モジュールの組込みが比較的容易に行える. |
(英) |
This paper describes embedding a mathematical formula recognition module into open source OCR system OCRopus aiming at developing a OCR system for scientific and technical documents which include mathematical formulas. OCRopus is a research open source OCR system emphasizing modularity, easy extensibility, and reuse. This system has several basic components such as preprocessing, layout analysis, text line recognition, so it is easy to embed the mathematical formula recognition module into OCRopus. |
キーワード |
(和) |
光学文字認識 / OCRopus / 数式認識 / / / / / |
(英) |
OCR / OCRopus / Mathematical formula recognition / / / / / |
文献情報 |
信学技報, vol. 110, no. 467, PRMU2010-267, pp. 177-182, 2011年3月. |
資料番号 |
PRMU2010-267 |
発行日 |
2011-03-03 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2010-267 |