講演抄録/キーワード |
講演名 |
2005-03-17 11:00
英文数学文書の正解付き文字・記号画像データベース ○野村明弘・内田誠一・鈴木昌和(九大) |
抄録 |
(和) |
英文数学文書の正解付き文字・記号画像データベース(InftyCDB-1)について,
その仕様と,文字および単語単位の解析結果について述べる.
本データベースでは,文書中のすべての文字ならびに記号それぞれについて,
文字種やフォント,異常文字正常文字の区別等の正解情報が付与されている.
さらに数式中の文字・記号については,その数式を木構造表現するために
必要十分な情報も付与されている.
また、単語データベースや数式画像データベースとしての利用も容易となるように
工夫している.本データベースは一般公開される予定である. |
(英) |
This paper is a specification of our ground-truthed mathematical character
and symbol image database, called InftyCDB-1.
The ground-truth of each character is composed of type, font, quality (touched/broken) and
link (relative position), etc.
The database includes all the characters and symbols of 467 pages of 30 articles
on mathematics, and is organized so that it can be used as word image database or
as mathematical formula image database. |
キーワード |
(和) |
数学文書 / OCR / 文字画像データベース / 単語データベース / 数式データベース / / / |
(英) |
mathematical documents / OCR / character image database / word database / formulae database / / / |
文献情報 |
信学技報, vol. 104, no. 741, PRMU2004-218, pp. 37-42, 2005年3月. |
資料番号 |
PRMU2004-218 |
発行日 |
2005-03-10 (TL, PRMU) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|
|