大会名称
2020年 総合大会
大会コ-ド
2020G
開催年
2020
発行日
2020-03-03
セッション番号
D-12B
セッション名
パターン認識・メディア理解B
講演日
2020/3/18
講演場所(会議室等)
工学部 講義棟2F 218講義室
講演番号
D-12-42
タイトル
画像のCNN特徴とLSTMのデンス結合構造を用いた画像キャプションの生成
著者名
○寄元康平韓 先花
キーワード
画像キャプション, デンス結合構造
抄録
画像のキャプション生成とは画像の内容をコンパクトに表現,理解し,画像に映る事象を言葉で説明出来る文章を生成するタスクである.近年深層学習を用いたさまざまな画像のキャプション生成手法が提案されている.その手法の多くは入力画像ではCNNを用いて表現特徴を抽出するEncoder,表現特徴を基にLSTMを用いて文章生成するDecoderで構成されているネットワーク構造が提案されている.本研究ではCNNから抽出した表現特徴をLSTMに連結させるデンス結合モデルを提案する.提案した手法と従来の手法の比較実験として,Flickr30kとMS-COCOの二つのキャプションデータを用いてそれぞれ手法にて生成した文章の精度をBLEU,METEORを用いて評価し提案した手法の有用性を検証する.
本文pdf
PDF download   

PayPerView