講演名 2000/2/21
レイアウト解析と文字認識に基づく文書画像のメディアコンバージョン
広瀬 克昌, 明 偉, 馬場口 登, 北橋 忠宏,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 画像として電子化された文書はデータ量や再利用などの点で問題がある.これに対してテキスト部分を文字認識によりコード化すれば, データ量は小さくなるもののリジェクト文字の発生やレイアウト情報の喪失などにより文書の再現性は必ずしも保証されなくなる.これに対処するためにはレイアウト解析による各領域の特徴抽出と領域分類, さらにはリジェクト文字にも対応できる再現可能な文書への変換処理が求められる.本報告では, 科学技術関連の文書画像をレイアウト解析と文字認識によって, 再現, 情報圧縮, 再利用が可能となるような文書メディアに変換するシステムを構築する.
抄録(英) Document images are memory-comsuming and difficult to be reused. Although coding the text area with OCR (Optical Character Reader) decreases volume of data, the coding sometimes loses its layout structure, i. e. coded documents cannot always maintain the original layout. In this paper, we propose a method of converting an original document image to a coded one based on two phases of document image processing : layout structure analysis and character recognition. This is proposed the conversion makes it possible to maintain layout structure, to decrease volume of data, and to reuse the original document.
キーワード(和) 文書画像処理 / 領域分類 / 文字認識 / メディア変換
キーワード(英) document image processing / segmentation / character recognition / media conversion
資料番号 PRMU99-224
発行日

研究会情報
研究会 PRMU
開催期間 2000/2/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) レイアウト解析と文字認識に基づく文書画像のメディアコンバージョン
サブタイトル(和)
タイトル(英) Media Conversion for Document Images Based on Layout Analysis and Character Recognition
サブタイトル(和)
キーワード(1)(和/英) 文書画像処理 / document image processing
キーワード(2)(和/英) 領域分類 / segmentation
キーワード(3)(和/英) 文字認識 / character recognition
キーワード(4)(和/英) メディア変換 / media conversion
第 1 著者 氏名(和/英) 広瀬 克昌 / Katsumasa HIROSE
第 1 著者 所属(和/英) 大阪大学産業科学研究所
Institute of Scientific and Industrial Research, Osaka University
第 2 著者 氏名(和/英) 明 偉 / Wei MING
第 2 著者 所属(和/英) 大阪大学産業科学研究所
Institute of Scientific and Industrial Research, Osaka University
第 3 著者 氏名(和/英) 馬場口 登 / Noboru BABAGUCHI
第 3 著者 所属(和/英) 大阪大学産業科学研究所
Institute of Scientific and Industrial Research, Osaka University
第 4 著者 氏名(和/英) 北橋 忠宏 / Tadahiro KITAHASHI
第 4 著者 所属(和/英) 大阪大学産業科学研究所
Institute of Scientific and Industrial Research, Osaka University
発表年月日 2000/2/21
資料番号 PRMU99-224
巻番号(vol) vol.99
号番号(no) 648
ページ範囲 pp.-
ページ数 8
発行日