講演名 2019-03-14
複数パッチ抽出によるアスペクト比を維持した画像審美度スコア予測
王 力捷(東大), 汪 雪?(東大), 山崎 俊彦(東大), 相澤 清晴(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) SNSの普及に伴い審美性の高い画像を機械的に選別・加工生成する需要が高まっており,本研究ではその根幹となる画像の審美性を評価するための画像のみを入力とした審美度スコアの予測を行った.我々はアスペクト比を維持した複数パッチ重み付け学習によって審美度スコア予測を行う手法を提案し,250,000枚以上の画像を利用した実験で,既存手法と比べて予測審美度スコアの相関係数が0.05以上上昇するなど審美度スコア予測性能が向上したことを示す.その中でも,特殊なアスペクト比を持つ画像の審美度スコア予測性能が特に大きく改善したことを示す.
抄録(英) According to the spread of Social Networking Services (SNS), there is the increasing demand for automatically selecting, editing or generating aesthetic images and it raises importance of evaluating image aesthetics. We propose a multi-patch image aesthetic score prediction method with preserving original aspect-ratios of original images. In the experiment with AVA dataset containing 250,000 images, our approach outperforms the existing method in image aesthetic score prediction, especially improved the linear correlation coefficient between predicted and ground truth aesthetic scores by 0.05. Noticeably, significant decrease in prediction errors is observed with images having minor aspect-ratios.
キーワード(和) 審美度 / 評点分布 / EMD / 複数パッチ学習 / 深層学習 / CNN
キーワード(英) image aesthetics / score distribution / EMD / multi-patch learning / deep learning / CNN
資料番号 IMQ2018-37,IE2018-121,MVE2018-68
発行日 2019-03-07 (IMQ, IE, MVE)

研究会情報
研究会 IMQ / IE / MVE / CQ
開催期間 2019/3/14(から2日開催)
開催地(和) 鹿児島大学 郡元キャンパス
開催地(英) Kagoshima University
テーマ(和) 五感メディア,マルチメディア,メディアエクスペリエンス, 映像符号化,イメージメディアの品質,ネットワークの品質 および信頼性,一般 (魅力工学(AC)研究会協賛)
テーマ(英) media of five senses, multimedia, media experience, picture codinge, image media quality, network,quality and reliability, etc
委員長氏名(和) 杉山 賢二(成蹊大) / 浜本 隆之(東京理科大) / 間瀬 健二(名大) / 林 孝典(広島工大)
委員長氏名(英) Kenji Sugiyama(Seikei Univ.) / Takayuki Hamamoto(Tokyo Univ. of Science) / Kenji Mase(Nagoya Univ.) / Takanori Hayashi(Hiroshima Inst. of Tech.)
副委員長氏名(和) 中口 俊哉(千葉大) / 前田 充(キヤノン) / 木全 英明(NTT) / 児玉 和也(NII) / 井原 雅行(NTT) / 下西 英之(NEC) / 岡本 淳(NTT)
副委員長氏名(英) Toshiya Nakaguchi(Chiba Univ.) / Mitsuru Maeda(Canon) / Hideaki Kimata(NTT) / Kazuya Kodama(NII) / Masayuki Ihara(NTT) / Hideyuki Shimonishi(NEC) / Jun Okamoto(NTT)
幹事氏名(和) 工藤 博章(名大) / 齊藤 新一郎(ソニー) / 河村 圭(KDDI総合研究所) / 高橋 桂太(名大) / 青木 良輔(NTT) / 内山 英昭(九大) / 平山 高嗣(名大) / 池上 大介(NTT) / 大田 健紘(日本工大)
幹事氏名(英) Hiroaki Kudo(Nagoya Univ.) / Shinichiro Saito(Sony) / Kei Kawamura(KDDI Research) / Keita Takahashi(Nagoya Univ.) / Ryosuke Aoki(NTT) / Hideaki Uchiyama(Kyushu Univ.) / Takatsugu Hirayama(Nagoya Univ.) / Daisuke Ikegami(NTT) / Kenko Ota(Nippon Inst. of Tech.)
幹事補佐氏名(和) 土田 勝(NTT) / 大橋 剛介(静岡大) / 早瀬 和也(NTT) / 松尾 康孝(NHK) / 西口 敏司(阪工大) / 横山 正典(*) / 佐々木 力(KDDI総合研究所) / 西川 由明(NEC) / 山本 嶺(電通大)
幹事補佐氏名(英) Masaru Tsuchida(NTT) / Gosuke Ohashi(Shizuoka Univ.) / Kazuya Hayase(NTT) / Yasutaka Matsuo(NHK) / Satoshi Nishiguchi(Oosaka Inst. of Tech.) / Masanori Yokoyama(*) / Chikara Sasaki(KDDI Research) / Yoshiaki Nishikawa(NEC) / Ryo Yamamoto(UEC)

講演論文情報詳細
申込み研究会 Technical Committee on Image Media Quality / Technical Committee on Image Engineering / Technical Committee on Media Experience and Virtual Environment / Technical Committee on Communication Quality
本文の言語 JPN
タイトル(和) 複数パッチ抽出によるアスペクト比を維持した画像審美度スコア予測
サブタイトル(和)
タイトル(英) Aspect-Ratio-Preserving Multi-Patch Image Aesthetic Score Prediction.
サブタイトル(和)
キーワード(1)(和/英) 審美度 / image aesthetics
キーワード(2)(和/英) 評点分布 / score distribution
キーワード(3)(和/英) EMD / EMD
キーワード(4)(和/英) 複数パッチ学習 / multi-patch learning
キーワード(5)(和/英) 深層学習 / deep learning
キーワード(6)(和/英) CNN / CNN
第 1 著者 氏名(和/英) 王 力捷 / Lijie Wang
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 2 著者 氏名(和/英) 汪 雪? / Xueting Wang
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 3 著者 氏名(和/英) 山崎 俊彦 / Toshihiko Yamasaki
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 4 著者 氏名(和/英) 相澤 清晴 / Kiyoharu Aizawa
第 4 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
発表年月日 2019-03-14
資料番号 IMQ2018-37,IE2018-121,MVE2018-68
巻番号(vol) vol.118
号番号(no) IMQ-500,IE-501,MVE-502
ページ範囲 pp.85-90(IMQ), pp.85-90(IE), pp.85-90(MVE),
ページ数 6
発行日 2019-03-07 (IMQ, IE, MVE)