講演名 | 2016-10-20 文字カテゴリの急所をCNNで探る 井手 将太(九大), 内田 誠一(九大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 印刷数字,手書き数字,多フォント数字を対象として,畳み込みニューラルネットワーク(CNN)による認識実験を行うと,どのデータについても非常に高い認識率が得られた.誤認識されたサンプルは人間にとっても難解なものがほとんどであったため,CNNの文字認識精度は人間の可読限界に近く,これはCNNが各文字カテゴリの本質を把握しているためではないかと考えられる.そこで本稿では,CNNが理解している文字の本質を実験的に探ることを考える.具体的には,入力文字画像を部分的に欠損させて,正解カテゴリの識別関数値や認識結果の変化を観察する.その結果,識別関数値が大きく低下する部分や認識不可能になる部分が現れれば,そこがすなわちCNNが該当文字カテゴリにとって必要不可欠と捉えている箇所(カテゴリの急所)だと推測できる.本稿では以上の実験を中心に論ずるとともに,関連した実験,例えばCNNの代わりにシンプルな最近傍識別(1NN)を用いた場合との比較なども論ずる. |
抄録(英) | |
キーワード(和) | 畳み込みニューラルネットワーク / 文字形状 / カテゴリ性 |
キーワード(英) | |
資料番号 | PRMU2016-96 |
発行日 | 2016-10-13 (PRMU) |
研究会情報 | |
研究会 | PRMU |
---|---|
開催期間 | 2016/10/20(から2日開催) |
開催地(和) | 宮崎大学 |
開催地(英) | |
テーマ(和) | オープンサイエンス~研究資源と研究体制のオープン化~ |
テーマ(英) | |
委員長氏名(和) | 前田 英作(NTT) |
委員長氏名(英) | Eisaku Maeda(NTT) |
副委員長氏名(和) | 内田 誠一(九大) / 藤吉 弘亘(中部大) |
副委員長氏名(英) | Seiichi Uchida(Kyushu Univ.) / Hironobu Fujiyoshi(Chubu Univ.) |
幹事氏名(和) | 近藤 一晃(京大) / 木村 昭悟(NTT) |
幹事氏名(英) | Kazuaki Kondo(Kyoto Univ.) / Akisato Kimura(NTT) |
幹事補佐氏名(和) | 大西 正輝(産総研) / 舩冨 卓哉(奈良先端大) |
幹事補佐氏名(英) | Masaki Oonishi(AIST) / Takuya Funatomi(NAIST) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Pattern Recognition and Media Understanding |
---|---|
本文の言語 | JPN-ONLY |
タイトル(和) | 文字カテゴリの急所をCNNで探る |
サブタイトル(和) | |
タイトル(英) | |
サブタイトル(和) | |
キーワード(1)(和/英) | 畳み込みニューラルネットワーク |
キーワード(2)(和/英) | 文字形状 |
キーワード(3)(和/英) | カテゴリ性 |
第 1 著者 氏名(和/英) | 井手 将太 / Shota Ide |
第 1 著者 所属(和/英) | 九州大学(略称:九大) Kyushu University(略称:Kyushu Univ.) |
第 2 著者 氏名(和/英) | 内田 誠一 / Seiichi Uchida |
第 2 著者 所属(和/英) | 九州大学(略称:九大) Kyushu University(略称:Kyushu Univ.) |
発表年月日 | 2016-10-20 |
資料番号 | PRMU2016-96 |
巻番号(vol) | vol.116 |
号番号(no) | PRMU-259 |
ページ範囲 | pp.31-36(PRMU), |
ページ数 | 6 |
発行日 | 2016-10-13 (PRMU) |