講演名 1997/3/6
多階層構造と階層間相互作用に基づく文書構造解析 : 多様な印刷文書を対象とした文書認識システム
石谷 康人, 宮本 隆司,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 多様な印刷文書をディジタル化するための文章構造解析方式について述べる。文書構造解析は文書画像からテキスト、写真、図形、フォーム領域を抽出し、テキスト領域からタイトルやパラグラフなどのレイアウトオブジェクトとその文字列を抽出するものである。本方式は(a)多階層構造、(b)階層間相互作用、(c)創発された大域構造とシステムとの相互作用というアーキテクチャを持つ。各階層は複数の処理モジュールで構成され、大域的な制御を受けず局所的に動作する。上位階層は下位階層の処理結果を変更、訂正、棄却、再調整でき、下位階層の挙動に対する境界条件を生み出す。このような階層間相互作用によりシステムは複雑な処理手順を生成することができる。また上記(c)によりシステムは文書構造に応じて動作するため多様な文書構造に自己適合でき、「縦書きと横書きのテキスト領域と図形が近接し入り組んでいる」という複雑な文書構造を解析することが可能となる。実験では本方式を様々な幾何構造を持つ文書に適用し、その有効性を確認している。
抄録(英) A new method of document image analysis is proposed for a document reader to be used for reading a wide variety of documents. The proposed method consists of the following concepts: (a) Multi-layer architecture with functional modules, (b) Adaptive self-organization of a global document structure based on the interactions between layers, (c) Local computations unguided by central control for global document analysis. A combination of the interactions between layers can produce the complex global behaviors of document analysis. The global layout structure of a document can be analyzed by such interactions, thus coping with the various geometric complexities of documents. This approach solves the complex problems of document analysis and deals with great variety of layout styles. Experiments on a variety of documents have shown that the method is robust and effective for various layout styles, even if a document image quality is poor.
キーワード(和) 文書構造解析 / レイアウト解析 / 創発 / 創発的計算 / 多階層構造 / 階層間相互作用
キーワード(英) document image analysis / layout analysis / emergence / emergent computation / multi layer architecture / interaction between layers
資料番号 PRMU96-169
発行日

研究会情報
研究会 PRMU
開催期間 1997/3/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 多階層構造と階層間相互作用に基づく文書構造解析 : 多様な印刷文書を対象とした文書認識システム
サブタイトル(和)
タイトル(英) Document Image Analysis Based on Multi Layer Architecture and Interaction Between Layers : Document Reading System for Various Printed Documents
サブタイトル(和)
キーワード(1)(和/英) 文書構造解析 / document image analysis
キーワード(2)(和/英) レイアウト解析 / layout analysis
キーワード(3)(和/英) 創発 / emergence
キーワード(4)(和/英) 創発的計算 / emergent computation
キーワード(5)(和/英) 多階層構造 / multi layer architecture
キーワード(6)(和/英) 階層間相互作用 / interaction between layers
第 1 著者 氏名(和/英) 石谷 康人 / Yasuto Ishitani
第 1 著者 所属(和/英) (株)東芝
Toshiba Corporation
第 2 著者 氏名(和/英) 宮本 隆司 / Takashi Miyamoto
第 2 著者 所属(和/英) (株)東芝
Toshiba Corporation
発表年月日 1997/3/6
資料番号 PRMU96-169
巻番号(vol) vol.96
号番号(no) 563
ページ範囲 pp.-
ページ数 8
発行日