講演名 2004/3/11
自由書式文書からの属性自動抽出・視覚化手法の検討(一般セッション(1))(ユビキタスコンピューティングのためのパターン認識・理解)
亀代 泰三, 平野 敬, 川村 秀男, 岡田 康裕,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 文書の電子化・共有化の進行に伴い,多種・多量の文書から有効な情報を迅速に把握するナレッジマネジメントの普及が期待されている.従来から文書の内容や傾向を把握するには文書毎に本文・要約等を一読する必要があり,大量文書を対象とする場合には多くの時間を要していた.そこで我々は多様な文書から氏名,組織名,日付,製品名等の属性を自動抽出して,文書を図や写真上の関連個所に表示することで直感的・効率的に大量文書の内容や傾向を把握できる情報視覚化手法を試作した.評価の結果,自由書式文書からの属性抽出における再現率88.9%,適合率97.3%であった.また視覚化インタフェースを用いることで文書の内容・傾向把握時間が13~51%に短縮され,本手法の有効性を確認した.
抄録(英) The technique of the knowledge management which grasp effective information quickly from a lot of documents is expected with increasing amount of shared documents. The conventional method requires much time to grasp the tendency of the documents because it needs to read summary of documents. To solve this problem, we have developed the information visualization technique in which the contents and the tendency of documents could be grasped intuitively and efficiently using the attribute automatically extracted from the document. As a result of evaluation, the recall rate of attribute extraction from a free-form document is 88.9%, and precision rate is 97.3%. The time to grasp information is shorten to 13%~51% by using our information visualizing interface.
キーワード(和) 属性抽出 / 視覚化 / 全文検索
キーワード(英) Document Attribute / Information Visualization / Document Retrieval
資料番号 PRMU2003-261
発行日

研究会情報
研究会 PRMU
開催期間 2004/3/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 自由書式文書からの属性自動抽出・視覚化手法の検討(一般セッション(1))(ユビキタスコンピューティングのためのパターン認識・理解)
サブタイトル(和)
タイトル(英) A Study on Visualizing Information by Using Attributes Extracted from Unconstraint Documents
サブタイトル(和)
キーワード(1)(和/英) 属性抽出 / Document Attribute
キーワード(2)(和/英) 視覚化 / Information Visualization
キーワード(3)(和/英) 全文検索 / Document Retrieval
第 1 著者 氏名(和/英) 亀代 泰三 / Taizo KAMESHIRO
第 1 著者 所属(和/英) 三菱電機(株)情報技術総合研究所
Information Technology R&D Center, Mitsubishi Electric Co.
第 2 著者 氏名(和/英) 平野 敬 / Takashi HIRANO
第 2 著者 所属(和/英) 三菱電機(株)情報技術総合研究所
Information Technology R&D Center, Mitsubishi Electric Co.
第 3 著者 氏名(和/英) 川村 秀男 / Hideo KAWAMURA
第 3 著者 所属(和/英) 三菱電機(株)情報技術総合研究所
Information Technology R&D Center, Mitsubishi Electric Co.
第 4 著者 氏名(和/英) 岡田 康裕 / Yasuhiro OKADA
第 4 著者 所属(和/英) 三菱電機(株)情報技術総合研究所
Information Technology R&D Center, Mitsubishi Electric Co.
発表年月日 2004/3/11
資料番号 PRMU2003-261
巻番号(vol) vol.103
号番号(no) 737
ページ範囲 pp.-
ページ数 6
発行日