講演抄録/キーワード |
講演名 |
2016-03-24 09:30
画像内領域の顕著性を考慮する画像の説明文自動生成 ○吉井和輝(豊橋技科大)・エリック ニコルズ・船越孝太郎・中野幹生(ホンダ・リサーチ・インスティチュート・ジャパン)・青野雅樹(豊橋技科大) BioX2015-41 PRMU2015-164 |
抄録 |
(和) |
近年、深層学習によって画像や言語の表現力が向上したことにより、画像説明文の自動生成などマルチモーダルなタスクが実現可能となっている.画像説明文の生成のための従来の典型的なアプローチは、画像特徴量から適切な単語を出力するニューラルネットを訓練することである.画像特徴量の抽出にはCNNが用いられるが、説明文生成に必要な画像内の情報を網羅することは難しい.本研究では、顕著性マップの情報を画像の説明文の自動生成手法に取り入れることを検討する.顕著性マップにより画面中の目立ったオブジェクトの領域を算出し、そこから顕著領域の画像特徴量を生成して利用することで、これらを用いなかった場合と比較して生成される説明文の品質が向上することを示す. |
(英) |
In recent years, due to advances in neural models for representing images and language, multimodal tasks like image captioning and visual QA have grown in popularity. Typical approaches are based in neural MT models where image region-text alignments are coupled with RNNs to generate captions. However, current approaches have difficulty covering all important regions in caption generation. To address this shortcoming, we introduce a novel image captioning system where salience maps are used to extract and featurize the most important image regions. In this paper, we propose several methods of generating saliency features and evaluate their impact on image captioning. |
キーワード |
(和) |
イメージキャプショニング / ニューラルネットワーク / 顕著性マップ / / / / / |
(英) |
Image Captioning / Neural Network / Saliency Map / / / / / |
文献情報 |
信学技報, vol. 115, no. 517, PRMU2015-164, pp. 1-6, 2016年3月. |
資料番号 |
PRMU2015-164 |
発行日 |
2016-03-17 (BioX, PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
BioX2015-41 PRMU2015-164 |