講演名 2016-03-07
漫画における文字領域の検出と認識
荒巻 祐治(東大), 松井 勇佑(東大), 山崎 俊彦(東大), 相澤 清晴(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究は,漫画のページ画像から文字領域を検出し,その領域に含まれる文字を認識することを目的とする.そのために,文字領域データセットを構築し,領域検出と文字認識についてそれぞれ提案を行う.データセットでは,漫画のページ画像に文字領域の位置,種類,文字列を付与することで,従来行われてこなかった大規模で定量的な評価を可能にする.検出手法は,幾何特徴を用いて分類した連結成分を統合することで効率的に候補領域を生成し,それらの候補領域を判別能力の高い深層特徴によって再度分類することで適合率を高めるものである.文字認識については,文字領域内の背景や振り仮名を除去すると共に,それをOCRで認識した結果をテキストコーパスを用いて修正する手法を提案する.構築したデータセットに対する評価実験により,提案した検出手法が従来の手法と比較して高いF値0.466を達成することを示し,提案した文字認識の改善手法によって文字エラー率を最大0.06低減できることを明らかにする.漫画に含まれる文字情報を抽出することで,文字を用いた検索や文脈を理解した処理,他言語への自動翻訳などの応用につながることが期待される.
抄録(英) In this paper, we develop a method to detect and recognize text regions in manga. The proposed detection method combined classifications for connected components and regions. To improve recognition accuracy, we remove noise objects before conducting optical character recognition (OCR) and correct misrecognition with text corpus after the OCR. We also constructed a large-scale dataset of text regions for learning and evaluation. We conducted experiments using our dataset, and the results showed our detection and recognition methods are more effective than previous methods. We expect our method can be applied for a lot of applications such as search by text or automatic translation of manga.
キーワード(和) 漫画 / 文字領域 / 検出 / 文字認識 / 文訂正
キーワード(英) manga / text regions / detection / OCR / sentence correction
資料番号 IMQ2015-41,IE2015-140,MVE2015-68
発行日 2016-02-29 (IMQ, IE, MVE)

研究会情報
研究会 IE / IMQ / MVE / CQ
開催期間 2016/3/7(から2日開催)
開催地(和) 名桜大
開催地(英)
テーマ(和) 五感メディア,食メディア,ソーシャルメディア,マルチメディア,仮想環境基礎,映像符号化,超臨場感,ネットワークの品質と信頼性,一般
テーマ(英)
委員長氏名(和) 高村 誠之(NTT) / 堀田 裕弘(富山大) / 小林 稔(明大) / 矢守 恭子(朝日大)
委員長氏名(英) Seishi Takamura(NTT) / Yuukou Horita(Univ. of Toyama) / Minoru Kobayashi(Meiji Univ.) / Kyoko Yamori(Asahi Univ.)
副委員長氏名(和) 浜本 隆之(東京理科大) / 市ヶ谷 敦郎(NHK) / 杉山 賢二(成蹊大) / 中口 俊哉(千葉大) / 亀田 能成(筑波大) / 林 孝典(NTT) / 下西 英之(NEC)
副委員長氏名(英) Takayuki Hamamoto(Tokyo Univ. of Science) / Atsuro Ichigaya(NHK) / Kenji Sugiyama(Seikei Univ.) / Toshiya Nakaguchi(Chiba Univ.) / Yoshinari Kameda(Univ. of Tsukuba) / Takanori Hayashi(NTT) / Hideyuki Shimonishi(NEC)
幹事氏名(和) 坂東 幸浩(NTT) / 宮田 高道(千葉工大) / 前田 充(キヤノン) / 工藤 博章(名大) / 杉本 麻樹(慶大) / 酒田 信親(阪大) / 三上 弾(NTT) / 山崎 康広(NEC) / 松田 崇弘(阪大)
幹事氏名(英) Yukihiro Bandoh(NTT) / Takamichi Miyata(Chiba Inst. of Tech.) / Mitsuru Maeda(Canon) / Hiroaki Kudo(Nagoya Univ.) / Maki Sugimoto(Keio Univ.) / Nobuchika Sakata(Osaka Univ.) / Dan Mikami(NTT) / Yasuhiro Yamasaki(NEC) / Takahiro Matsuzaki(Osaka Univ.)
幹事補佐氏名(和) 高橋 桂太(名大) / 河村 圭(KDDI研) / 齊藤 新一郎(ソニー) / 土田 勝(NTT) / 上岡 玲子(九大) / 飯山 将晃(京大) / 木村 篤信(NTT) / 山本 雅大(OKI) / 古 博(早大) / アベセカラ ヒランタ(NTT)
幹事補佐氏名(英) Keita Takahashi(Nagoya Univ.) / Kei Kawamura(KDDI R&D Labs.) / Shinichiro Saito(Sony) / Masaru Tsuchida(NTT) / Reiko Ueoka(Kyushu Univ.) / Masaaki Iiyama(Kyoto Univ.) / Atsunobu Kimura(NTT) / Masahiro Yamamoto(OKI) / Bo GU(Waseda Univ.) / Hirantha Abeysekera(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Image Engineering / Technical Committee on Image Media Quality / Technical Committee on Multimedia and Virtual Environment / Technical Committee on Communication Quality
本文の言語 JPN
タイトル(和) 漫画における文字領域の検出と認識
サブタイトル(和)
タイトル(英) Text region detection and recognition in manga
サブタイトル(和)
キーワード(1)(和/英) 漫画 / manga
キーワード(2)(和/英) 文字領域 / text regions
キーワード(3)(和/英) 検出 / detection
キーワード(4)(和/英) 文字認識 / OCR
キーワード(5)(和/英) 文訂正 / sentence correction
第 1 著者 氏名(和/英) 荒巻 祐治 / Yuji Aramaki
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 2 著者 氏名(和/英) 松井 勇佑 / Yusuke Matsui
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 3 著者 氏名(和/英) 山崎 俊彦 / Toshihiko Yamasaki
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 4 著者 氏名(和/英) 相澤 清晴 / Kiyoharu Aizawa
第 4 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
発表年月日 2016-03-07
資料番号 IMQ2015-41,IE2015-140,MVE2015-68
巻番号(vol) vol.115
号番号(no) IMQ-493,IE-494,MVE-495
ページ範囲 pp.73-78(IMQ), pp.73-78(IE), pp.73-78(MVE),
ページ数 6
発行日 2016-02-29 (IMQ, IE, MVE)