講演名 2001/3/16
書式構造文法を用いた表構造の解析と合成文書の生成
住吉 泰士, 本山 貴之, 鈴木 弘二, 天野 晃, 浅田 尚紀,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 履歴書や研究計画書など罫線による多数の枠で構成された文書(罫線文書)に氏名や数値等を記入する機会は多い.本論文では,多種多様な罫線文書を対象に,ユーザが記入欄や挿入欄の分類規則と記入すべき情報(文字や画像など)を与えると,所定の欄に指定した情報を自動記入する合成文書作成支援システムについて述べる.従来の研究で,罫線で構成された長方形枠(ボックス)の1次元的な接続・指示関係を書式構造文法に基づいて解析するシステムを実現したが,表構造などの2次元的な指示関係は解析できなかった.本論文では,2次元的な指示関係を縦方向と横方向2種類の指示関係が合成されたものと考え,縦方向と横方向の指示関係解析を従来の1次元指示関係解析を利用して行い,これらを統合することで2次元指示関係解析を行う方法を提案する.実文書に対して本システムを適用し,指示通りの合成文書が作成できることを確認した.
抄録(英) In this paper, we propose a synthetic document generation system which generates LATEXcodes for filled-in ruled form documents. Providing a non-filled-in ruled form document, the system analyzes the logical relations of each fill-in areas separated by vertical and horizontal rules according to the box types provided by users based on the document structure grammer. Subsequently, it generates LATEXcode which recovers the original document and fill-in contents provided by users filled-in. In our previous work, we have produced a system which analyzes one dimensional logical relations using document structure grammer. However, it couldn't handle two dimensional logical relations such as table structures. In this paper, we propose a method to analyze both one dimensional and two dimensional logical relations by integrating two results of document structure analysis which are vertical and horizontal precedent document structure analysis. Experimental results on research proposal document shows effectiveness of our system.
キーワード(和) 罫線文書画像 / 文書構造解析 / 表構造 / 書式構造文法 / 文書作成支援 / LATEXコード
キーワード(英) Ruled Form Document / Document Structure Analysis / Table Form / Document Structure Grammer
資料番号 PRMU2000-225
発行日

研究会情報
研究会 PRMU
開催期間 2001/3/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 書式構造文法を用いた表構造の解析と合成文書の生成
サブタイトル(和)
タイトル(英) Table-Form Document Synthesis using Document Structure Grammer
サブタイトル(和)
キーワード(1)(和/英) 罫線文書画像 / Ruled Form Document
キーワード(2)(和/英) 文書構造解析 / Document Structure Analysis
キーワード(3)(和/英) 表構造 / Table Form
キーワード(4)(和/英) 書式構造文法 / Document Structure Grammer
キーワード(5)(和/英) 文書作成支援
キーワード(6)(和/英) LATEXコード
第 1 著者 氏名(和/英) 住吉 泰士 / Taiji SUMIYOSHI
第 1 著者 所属(和/英) 広島市立大学情報科学部知能情報システム工学科
Department of Intelligent Systems, Hiroshima City University
第 2 著者 氏名(和/英) 本山 貴之 / Takayuki MOTOYAMA
第 2 著者 所属(和/英) 広島市立大学情報科学部知能情報システム工学科
Department of Intelligent Systems, Hiroshima City University
第 3 著者 氏名(和/英) 鈴木 弘二 / Koji SUZUKI
第 3 著者 所属(和/英) 広島市立大学情報科学部知能情報システム工学科
Department of Intelligent Systems, Hiroshima City University
第 4 著者 氏名(和/英) 天野 晃 / Akira AMANO
第 4 著者 所属(和/英) 広島市立大学情報科学部知能情報システム工学科
Department of Intelligent Systems, Hiroshima City University
第 5 著者 氏名(和/英) 浅田 尚紀 / Naoki ASADA
第 5 著者 所属(和/英) 広島市立大学情報科学部知能情報システム工学科
Department of Intelligent Systems, Hiroshima City University
発表年月日 2001/3/16
資料番号 PRMU2000-225
巻番号(vol) vol.100
号番号(no) 702
ページ範囲 pp.-
ページ数 8
発行日