講演名 2021-03-02
[ショートペーパー]AttnGANを用いた画像生成における各種パラメータの基礎調査
高橋 政義(埼玉工大), 山崎 隆治(埼玉工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,機械学習技術の発展が目覚ましく,特にディープラーニングによる研究が盛んに行われており,その中でも敵対的生成ネットワーク(GAN:Generative Adversarial Networks)が注目されている.これは生成モデルの一種で,実際には存在しないデータを生成することができる.本研究では数多く提案されているGANの手法の中で,テキストデータから画像を生成するAttentional GAN(AttnGAN)に着目し,様々な分野での応用を目指し,その実装と基本的な性能を調査した.学習データ数を増加させたネットワークを用いた場合,同じテキストデータからでも詳細に画像を生成することができた.また,事前学習のバッチサイズを変更した場合,バッチサイズが大きくなると画像が鮮明になる結果が示された.学習のテキストデータ内の使用頻度が高い単語で構成した文章から画像を生成した場合は,文章に忠実に画像が生成された.一方で,使用頻度の低い単語で構成された文章から画像を生成した場合は,文章通りの生成結果が得られず,画像が崩れてしまう傾向にあった.
抄録(英)
キーワード(和) 機械学習 / ディープラーニング / テキストデータ / GAN / AttnGAN / Text-to-image
キーワード(英)
資料番号 IMQ2020-28,IE2020-68,MVE2020-60
発行日 2021-02-22 (IMQ, IE, MVE)

研究会情報
研究会 MVE / IMQ / IE / CQ
開催期間 2021/3/1(から3日開催)
開催地(和) オンライン開催(崇城大学から変更)
開催地(英) Online
テーマ(和) 五感に訴えるオンラインメディアとその評価,および一般 (魅力工学(AC)研究会協賛)
テーマ(英)
委員長氏名(和) 井原 雅行(NTT) / 中口 俊哉(千葉大) / 木全 英明(NTT) / 下西 英之(NEC)
委員長氏名(英) Masayuki Ihara(NTT) / Toshiya Nakaguchi(Chiba Univ.) / Hideaki Kimata(NTT) / Hideyuki Shimonishi(NEC)
副委員長氏名(和) 清川 清(奈良先端大) / 前田 充(キヤノン) / 魚森 謙也(阪大) / 児玉 和也(NII) / 高橋 桂太(名大) / 岡本 淳(NTT) / 平栗 健史(日本工大)
副委員長氏名(英) Kiyoshi Kiyokawa(NAIST) / Mitsuru Maeda(Canon) / Kenya Uomori(Osaka Univ.) / Kazuya Kodama(NII) / Keita Takahashi(Nagoya Univ.) / Jun Okamoto(NTT) / Takefumi Hiraguri(Nippon Inst. of Tech.)
幹事氏名(和) 西口 敏司(阪工大) / 横山 正典(NTT) / 福嶋 政期(東大) / 大橋 剛介(静岡大) / 齊藤 新一郎(ソニーセミコンダクタソリューションズ) / 海野 恭平(KDDI総合研究所) / 福嶋 慶繁(名工大) / 木村 共孝(同志社大) / 山中 広明(NICT) / アベセカラ ヒランタ(NTT)
幹事氏名(英) Satoshi Nishiguchi(Oosaka Inst. of Tech.) / Masanori Yokoyama(NTT) / Shogo Fukushima(Univ. of ToKyo) / Gosuke Ohashi(Shizuoka Univ.) / Shinichiro Saito(Sony Semiconductor Solutions) / Kyohei Unno(KDDI Research) / Norishige Fukushima(Nagoya Inst. of Tech.) / Tomotaka Kimura(Doshisha Univ.) / Hiroaki Yamanaka(NICT) / Hirantha Abeysekera(NTT)
幹事補佐氏名(和) 磯山 直也(奈良先端大) / 原 豪紀(大日本印刷) / 後藤 充裕(NTT) / 工藤 博章(名大) / 土田 勝(NTT) / 平井 経太(千葉大) / 岩村 俊輔(NHK) / 工藤 忍(NTT) / 西川 由明(NEC) / 木村 拓人(NTT) / 堅岡 良知(KDDI総合研究所)
幹事補佐氏名(英) Naoya Isoyama(NAIST) / Takenori Hara(DNP) / Mitsuhiro Goto(NTT) / Hiroaki Kudo(Nagoya Univ.) / Masaru Tsuchida(NTT) / Keita Hirai(Chiba Univ.) / Shunsuke Iwamura(NHK) / Shinobu Kudo(NTT) / Yoshiaki Nishikawa(NEC) / Takuto Kimura(NTT) / Ryoichi Kataoka(KDDI Research)

講演論文情報詳細
申込み研究会 Technical Committee on Media Experience and Virtual Environment / Technical Committee on Image Media Quality / Technical Committee on Image Engineering / Technical Committee on Communication Quality
本文の言語 JPN-ONLY
タイトル(和) [ショートペーパー]AttnGANを用いた画像生成における各種パラメータの基礎調査
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 機械学習
キーワード(2)(和/英) ディープラーニング
キーワード(3)(和/英) テキストデータ
キーワード(4)(和/英) GAN
キーワード(5)(和/英) AttnGAN
キーワード(6)(和/英) Text-to-image
第 1 著者 氏名(和/英) 高橋 政義 / Masayoshi Takahashi
第 1 著者 所属(和/英) 埼玉工業大学(略称:埼玉工大)
Saitama Institute of Technology(略称:SIT)
第 2 著者 氏名(和/英) 山崎 隆治 / Takaharu Yamazaki
第 2 著者 所属(和/英) 埼玉工業大学(略称:埼玉工大)
Saitama Institute of Technology(略称:SIT)
発表年月日 2021-03-02
資料番号 IMQ2020-28,IE2020-68,MVE2020-60
巻番号(vol) vol.120
号番号(no) IMQ-389,IE-390,MVE-391
ページ範囲 pp.87-90(IMQ), pp.87-90(IE), pp.87-90(MVE),
ページ数 4
発行日 2021-02-22 (IMQ, IE, MVE)