講演名 2005-06-17
文字認識と単語レイアウト解析を用いた紙文書とデジタルデータの情報リンク手法(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
嶺 竜治, 亀山 達也, 高橋 寿一, 古賀 昌史, 緒方 日佐男,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 文字認識と単語レイアウト解析技術を用いて, 読み取った複数単語の配置関係から, 文書の種別や読み取り位置を特定する手法を提案する.また, この手法を用いて, 紙文書とデジタルデータのハイパーリンクを実現するプロトタイプを開発した.具体的には, カメラ付き携帯電話で紙面上の複数の単語を読み取って, その認識結果と単語の配置関係をサーバに送信し, サーバ側であらかじめ作成しておいたテキストデータと照合して, 文書の種別, ページ番号, ページ中の位置を特定し, 関連する情報を携帯電話に返信する.この技術を用いれば, バーコード等を文書に印刷することなくハイパーリンクが実現できる.また既に出版された文書に新たなサービスを付加することができる.4種の新聞を用いた小規模な実験で, 97%の精度で新聞種の特定を, また新聞種が特定できればほぼ正しいページ位置を特定できることがわかった.今後は実験の規模を拡大するとともに, 本方式を用いた様々なサービスの検討を行う予定である.
抄録(英) We propose a method to identify the paper document and estimate the reading position by using OCR and word layout analysis technology. Based on the method, we developed the prototype system by which hyperlink between paper document and digital contents space was realized. In the prototype system, the resu lts of character recognition and word layout analysis are transmitted to the contents server, and relevant information is replied, referring database that contains collation table of document type, page number, row number, column number and contents. By the method, hyperlink is put to practical use without printing the bar code on the paper document. Moreover, new service can be added to the paper document that has been already published. As the result of small experiment, the proposed method can identify the paper document by the accuracy of the 97% in the case of four newspapers. We will expand the experiments for practical use and examine the possibilities for various services that use the proposed method.
キーワード(和) 文字認識 / ハイパーリンク / 携帯電話 / 単語レイアウト解析
キーワード(英) Character Recognition / Hyperlink / Mobile Phone / Word Layout Analysis
資料番号 DE2005-15,PRMU2005-36
発行日

研究会情報
研究会 PRMU
開催期間 2005/6/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 文字認識と単語レイアウト解析を用いた紙文書とデジタルデータの情報リンク手法(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
サブタイトル(和)
タイトル(英) A Hyperlink Connecting Paper Document to Digital Information Using Character Recognition and Word Layout Analysis
サブタイトル(和)
キーワード(1)(和/英) 文字認識 / Character Recognition
キーワード(2)(和/英) ハイパーリンク / Hyperlink
キーワード(3)(和/英) 携帯電話 / Mobile Phone
キーワード(4)(和/英) 単語レイアウト解析 / Word Layout Analysis
第 1 著者 氏名(和/英) 嶺 竜治 / Ryuji MINE
第 1 著者 所属(和/英) 株式会社日立製作所中央研究所
Central Research Laboratory, Hitachi, Ltd.
第 2 著者 氏名(和/英) 亀山 達也 / Tatsuya KAMEYAMA
第 2 著者 所属(和/英) 株式会社日立製作所中央研究所
Central Research Laboratory, Hitachi, Ltd.
第 3 著者 氏名(和/英) 高橋 寿一 / Toshikazu TAKAHASHI
第 3 著者 所属(和/英) 株式会社日立製作所中央研究所
Central Research Laboratory, Hitachi, Ltd.
第 4 著者 氏名(和/英) 古賀 昌史 / Masashi KOGA
第 4 著者 所属(和/英) 株式会社日立製作所中央研究所
Central Research Laboratory, Hitachi, Ltd.
第 5 著者 氏名(和/英) 緒方 日佐男 / Hisao OGATA
第 5 著者 所属(和/英) 日立オムロンターミナルソリューションズ株式会社
Hitachi-Omron Terminal Solutions, Corp.
発表年月日 2005-06-17
資料番号 DE2005-15,PRMU2005-36
巻番号(vol) vol.105
号番号(no) 119
ページ範囲 pp.-
ページ数 6
発行日