講演抄録/キーワード |
講演名 |
2018-09-20 10:20
CNNを用いた近代文献画像からのテキスト領域抽出 ○永野雄大・幡谷龍一郎・増田勝也(東大)・持橋大地(統計数理研) PRMU2018-47 IBISML2018-24 |
抄録 |
(和) |
文献の情報を有効に利用するためには, テキストデータ化が必要であり, それにより文章解析や検索などを行うことが可能となる. 一方で, 市販の OCR ソフトウェアは, 字体やレイアウトなどが現代のものと異なるなどの要因により, 近代文献からのテキスト領域抽出が困難である. そのため, 近代文献の自動データ化の研究は期待が高まっている. また, データ化すべき近代文献は莫大なため, テキスト領域抽出の自動化による恩恵は大きく, 重要なタスクである. 本稿では, 機械学習の実応用として, 深層畳み込みニューラルネットワーク (CNN) を用い, 近代文献からテキスト領域抽出を行う. $5$ 冊の近代文献を用い学習・評価を行い, 深層畳み込みニューラルネットワークで行えるテキスト領域抽出の性能, またアノテーションに必要なデータの枚数の確認を行う. |
(英) |
(Not available yet) |
キーワード |
(和) |
テキスト領域抽出 / レイアウト解析 / 畳み込みニューラルネットワーク / 画像処理 / / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 118, no. 219, PRMU2018-47, pp. 73-78, 2018年9月. |
資料番号 |
PRMU2018-47 |
発行日 |
2018-09-13 (PRMU, IBISML) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2018-47 IBISML2018-24 |
研究会情報 |
研究会 |
PRMU IBISML IPSJ-CVIM |
開催期間 |
2018-09-20 - 2018-09-21 |
開催地(和) |
福岡工業大学 |
開催地(英) |
|
テーマ(和) |
機械学習と実応用 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
PRMU |
会議コード |
2018-09-PRMU-IBISML-CVIM |
本文の言語 |
日本語 |
タイトル(和) |
CNNを用いた近代文献画像からのテキスト領域抽出 |
サブタイトル(和) |
|
タイトル(英) |
Text Region Extraction in Page Images of Modern Literature using Convolutional Neural Networks |
サブタイトル(英) |
|
キーワード(1)(和/英) |
テキスト領域抽出 / |
キーワード(2)(和/英) |
レイアウト解析 / |
キーワード(3)(和/英) |
畳み込みニューラルネットワーク / |
キーワード(4)(和/英) |
画像処理 / |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
永野 雄大 / Yudai Nagano / ナガノ ユウダイ |
第1著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo) |
第2著者 氏名(和/英/ヨミ) |
幡谷 龍一郎 / Ryuichiro Hataya / ハタヤ リュウイチロウ |
第2著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo) |
第3著者 氏名(和/英/ヨミ) |
増田 勝也 / Katsuya Masuda / |
第3著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo) |
第4著者 氏名(和/英/ヨミ) |
持橋 大地 / Daichi Mochihashi / モチハシ ダイチ |
第4著者 所属(和/英) |
統計数理研究所 数理・推論研究系 (略称: 統計数理研)
The Institute of Statistical Mathematics (略称: ISM) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2018-09-20 10:20:00 |
発表時間 |
10分 |
申込先研究会 |
PRMU |
資料番号 |
PRMU2018-47, IBISML2018-24 |
巻番号(vol) |
vol.118 |
号番号(no) |
no.219(PRMU), no.220(IBISML) |
ページ範囲 |
pp.73-78 |
ページ数 |
6 |
発行日 |
2018-09-13 (PRMU, IBISML) |
|