電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2013-03-14 15:05
OCRopusを用いた数式を含む科学技術文献の読取りシステム
古郡史啓宮岸高規・○白井啓一郎岡本正行信州大PRMU2012-193
抄録 (和) 本研究では,オープンソースのOCRソフトであるOCRopusへの数式認識モジュールの組込みを目的とし,本稿では特にインライン数式の抽出を取り扱う.
数式を含むテキストラインを単語単位に分割し言語モデルとの照合を行えば,数式部分と通常の単語とをかなりの正確さで区別できる.
また,数式は文字の外接矩形のアスペクト比がばらつく傾向があるため,
外接矩形に関連する特徴量を用いてSVMによる識別を行い,数式の抽出率を高めている. 
(英) This paper describes installation of a mathematical formula recognition module into open source OCR system OCRopus, especially we consider the identification of inline formulas. Splitting a textline which includes math formulas into words and verifying them using a language model, we can distinguish the math formulas from words. Additionally, because the math formulas tend to have a variety of bounding boxes of symbols aspect ratios, we employ SVM using features associated with the bounding boxes so as to improve the accuracy of identification.
キーワード (和) 光学文字認識 / OCRopus / 数式認識 / / / / /  
(英) OCR / OCRopus / Mathematical formula recognition / / / / /  
文献情報 信学技報, vol. 112, no. 495, PRMU2012-193, pp. 75-79, 2013年3月.
資料番号 PRMU2012-193 
発行日 2013-03-07 (PRMU) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード PRMU2012-193

研究会情報
研究会 PRMU  
開催期間 2013-03-14 - 2013-03-15 
開催地(和) 電気通信大学 
開催地(英)  
テーマ(和) 文字・文書の認識と理解およびアルゴリズム・システム評価 
テーマ(英)  
講演論文情報の詳細
申込み研究会 PRMU 
会議コード 2013-03-PRMU 
本文の言語 日本語 
タイトル(和) OCRopusを用いた数式を含む科学技術文献の読取りシステム 
サブタイトル(和)  
タイトル(英) An OCR system with OCRopus for scientific documents containing mathematical expressions 
サブタイトル(英)  
キーワード(1)(和/英) 光学文字認識 / OCR  
キーワード(2)(和/英) OCRopus / OCRopus  
キーワード(3)(和/英) 数式認識 / Mathematical formula recognition  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 古郡 史啓 / Fumihiro Furukori / フルコオリ フミヒロ
第1著者 所属(和/英) 信州大学 (略称: 信州大)
Shinshu University (略称: Shinshu Univ.)
第2著者 氏名(和/英/ヨミ) 宮岸 高規 / Takanori Miyagishi / ミヤギシ タカノリ
第2著者 所属(和/英) 信州大学 (略称: 信州大)
Shinshu University (略称: Shinshu Univ.)
第3著者 氏名(和/英/ヨミ) 白井 啓一郎 / Keiichiro Shirai / シライ ケイイチロウ
第3著者 所属(和/英) 信州大学 (略称: 信州大)
Shinshu University (略称: Shinshu Univ.)
第4著者 氏名(和/英/ヨミ) 岡本 正行 / Masayuki Okamoto / オカモト マサユキ
第4著者 所属(和/英) 信州大学 (略称: 信州大)
Shinshu University (略称: Shinshu Univ.)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2013-03-14 15:05:00 
発表時間 30 
申込先研究会 PRMU 
資料番号 IEICE-PRMU2012-193 
巻番号(vol) IEICE-112 
号番号(no) no.495 
ページ範囲 pp.75-79 
ページ数 IEICE-5 
発行日 IEICE-PRMU-2013-03-07 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会