講演名 1998/5/22
文字行の局所的な直線性を利用した任意方向文字行抽出法
後藤 英昭, 阿曽 弘具,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々は以前, 複雑なレイアウトの文書にも適用でき, 頑健性も備えた文字行抽出手法-区分直線連結法 (Linear Segment Linking; LSL 法)-を提案した.この手法では湾曲した文字行も取り扱えるが, 文字行の局所的な傾きは画像の水平軸と垂直軸に対してそれぞれ±7゜程度に限定されていた.この区分直線連結法を基に, 本研究では任意方向や曲線上に配置された文字行を抽出できる新しい手法を開発した.日本語文書では縦書きと横書きの自動判別が必要であるが, その問題に配慮して, 本手法では複数方向の文字行候補を生成できるようにした.本手法は文章ブロックの抽出を伴わないので, 文書のレイアウトに対する制限が非常に少ない.また, 実験により本手法の有効性が認識された.
抄録(英) We have proposed the robust method for text line extraction, Linear Segment Linking(LSL)method, which was applicable to the document images with very complex layout. The LSL has the advantage that it is able to extract slightly bent text lines, however, the angle of local skew of text line is limited to around ±7゜ from the horizontal and vertical axes of image. We improve the LSL and develop a new method which is able to extract arbitrarily oriented text lines or curved ones. We consider the existence of both horizontally and vertically printed text lines in a same page, which are often seen in Japanese documents, and make it possible to obtain text line candidates in multiple orientations. The new method gives few limitations to document layout because the method is independent of text block extraction. We verify the performance of the method by some experiments.
キーワード(和) 文字行抽出 / 文書レイアウト解析 / 区分直線連結法(LSL) / 文章ブロック抽出
キーワード(英) text line extraction / document layout analysis / Linear Segment Linking / text block extraction
資料番号
発行日

研究会情報
研究会 PRMU
開催期間 1998/5/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 文字行の局所的な直線性を利用した任意方向文字行抽出法
サブタイトル(和)
タイトル(英) Extracting Arbitrarily Oriented Text Lines Using Local Linearity of Text Line
サブタイトル(和)
キーワード(1)(和/英) 文字行抽出 / text line extraction
キーワード(2)(和/英) 文書レイアウト解析 / document layout analysis
キーワード(3)(和/英) 区分直線連結法(LSL) / Linear Segment Linking
キーワード(4)(和/英) 文章ブロック抽出 / text block extraction
第 1 著者 氏名(和/英) 後藤 英昭 / Hideaki GOTO
第 1 著者 所属(和/英) 東北大学情報処理教育センター
Education Center for Information Processing, Tohoku University
第 2 著者 氏名(和/英) 阿曽 弘具 / Hirotomo ASO
第 2 著者 所属(和/英) 東北大学大学院工学研究科
Graduate School of Engineering, Tohoku University
発表年月日 1998/5/22
資料番号
巻番号(vol) vol.98
号番号(no) 70
ページ範囲 pp.-
ページ数 8
発行日