IEICE Technical Report

Online edition: ISSN 2432-6380

Volume 120, Number 409

Pattern Recognition and Media Understanding

Workshop Date : 2021-03-04 - 2021-03-05 / Issue Date : 2021-02-25

[TOP] | [2017] | [2018] | [2019] | [2020] | [2021] | [2022] | [2023] | [Japanese] / [English]

PRMU2020-69
Automatic 3D Mesh Generation by Using Extended Attentive Normalization
Yuta Fukatsu, Masaki Aono (TUT)
pp. 1 - 6

PRMU2020-70
Discrimination between Real and Cloned Images by Ensemble Learning of GAN Discriminators
Naoki Hamasaki, Kazuaki Nakamura, Naoko Nitta, Noboru Babaguchi (Osaka Univ.)
pp. 7 - 12

PRMU2020-71
Saliency Detection by Extended Attention and its Application to Image Synthesis
Ryosuke Yamauchi, Masaki Aono (TUT)
pp. 13 - 18

PRMU2020-72
Semi-supervised temporal image sequence generation conditioned on non-visual sensor signals
Kawakami Sota, Kei Okada, Naoko Nitta, Kazuaki Nakamura, Noboru Babaguchi (Osaka Univ.)
pp. 19 - 24

PRMU2020-73
Learning Convolutional Neural Networks with Spatial Frequency Loss
Naoyuki Ichimura (AIST)
pp. 25 - 30

PRMU2020-74
[Short Paper] High-Resolution Image Completion by Hierarchical Neural Process
Masato Miyahara, Daisuke Sato, Masato Fukuda, Narimune Matsumura, Yoshiki Nishikawa (NTT)
pp. 31 - 34

PRMU2020-75
multi-modal action recognition system -- recognizing actions based on RGB video, skeleton, audio and text data --
Hang Yuan, Taichi Imura, Misaki Fujishiro, Takashi Suenaga, Kengo Makino, Yuto Yamanoue (NTT Data)
pp. 35 - 40

PRMU2020-76
Leveraging Human Pose Estimation Model for Sports Video Classification
Soichiro Sato, Masaki Aono (TUT)
pp. 41 - 46

PRMU2020-77
Evaluations on Two-stream Feature-fusion Architecture with Shifting-subclip and Hard Positive Mining for Person Re-identification
Yuki Hiroi, Wataru Kameyama (Waseda Univ.)
pp. 47 - 52

PRMU2020-78
Word-level sign language recognition with Multi-stream Neural Networks Focusing on Local Region
Mizuki Maruyama (Osaka Pref. Univ.), Shuvozit Ghose (IIT), Katsufumi Inoue (Osaka Pref. Univ.), Partha Pratim Roy (IIT), Masakazu Iwamura, Michifumi Yoshioka (Osaka Pref. Univ.)
pp. 53 - 58

PRMU2020-79
Automated Segmentation of Left Ventirular Wall and Extraction of Left Ventricular Cavity in Echocardiographic Images by Deep Learning
Kai Wang, JiWei Zhang (Wakayama Univ.), Takeshi Hozumi (Wakayama Medical Univ.), HaiYuan Wu (Wakayama Univ.)
pp. 59 - 64

PRMU2020-80
Media detection from cardiovascular OCT images based on deep learning
jiwei zhang, kai wang (wakayama univ), Takashi Kubo (Wakayama Medical Univ), haiyuan wu (wakayama univ)
pp. 65 - 70

PRMU2020-81
VQA for Medical Image Data based on Image Feature Extraction and Fusion
Hideo Umada, Masaki Aono (TUT)
pp. 71 - 76

PRMU2020-82
Quantifying detection quality in the presence of adversarial inputs in dermatological images
Mishra Sourav (UTokyo), Hideaki Imaizumi (exMedio), Toshihiko Yamasaki (UTokyo)
pp. 77 - 82

PRMU2020-83
[Short Paper] A CNN-Transformer-Based Network for Depression Recognition
Liu Jiaqing (Ritsumei), Huang Yue, Huang Xinren (Soochow), Tateyama Tomoko (Shiga University), Iwamoto Yutaro, Chen Yanwei (Ritsumei)
pp. 83 - 85

PRMU2020-84
A discussion on live sampling techniques for sound materials in media art
Yoichi Nagashima (SUAC)
pp. 86 - 90

PRMU2020-85
Improved Speech Separation Performance from Monaural Mixed Speech Based on Deep Embedding Network
Shaoxiang Dang, Tetsuya Matsumoto, Hiroaki Kudo (Nagoya Univ.), Yoshinori Takeuchi (Daido Univ.)
pp. 91 - 96

PRMU2020-86
Automatic music transcription system based on convolutional neural network for electric guitar considering sounds of same pitch and different strings
Toshiaki Matsui, Tetsuya Matsumoto, Hiroaki Kudo (Nagoya Univ), Yoshinori Takeuchi (Daido Univ)
pp. 97 - 102

PRMU2020-87
Counting Fruits and Flowers by Using Object Detection with Time-Lapse Camera Images
Akihiro Tanikawa, Yuma Usui, Takaya Matsumoto (KUT/Office asoT), Mitsuhiro Osaki, Kazuma Nishiuchi (Citynet), Masahiro Fukumoto (KUT)
pp. 103 - 108

PRMU2020-88
Remote estimation of relative sugar content in persimmon field by UAV with multi-spectral camera
Katsuya Oseki, Yasushi Kanazawa (Toyohashi University of Tech.)
pp. 109 - 114

PRMU2020-89
(See Japanese page.)
pp. 115 - 120

PRMU2020-90
A Consideration on Suspicious Object Detection by Mixup and Improved U-Net
Naruki Kanno, Wataru Kameyama, Toshio Sato, Yutaka Katsuyama, Takuro Sato (Waseda Univ.)
pp. 121 - 126

PRMU2020-91
Semantic Segmentation based on MobileNet Extended with FPN
Yuki Sugimoto, Masaki Aono (TUT)
pp. 127 - 132

PRMU2020-92
Learning from Synthetic Shadows
Naoto Inoue, Toshihiko Yamasaki (UTokyo)
pp. 133 - 138

PRMU2020-93
Improving Accuracy on Biased Datasets via Explanations of Deep Neural Networks
Kazuki Adachi, Shin'ya Yamaguchi (NTT)
pp. 139 - 144

PRMU2020-94
Switch State Detection by MSRS and YOLOv4 and Automatic Switch Operation with a Robot Arm by Reinforcement Learning in Virtual Environments
Li Qi, Jun Ohya (Waseda Univ.), Hiroyuki Ogata (Seikei Univ.)
pp. 145 - 150

PRMU2020-95
Retrieving Interesting Planetary Images based on Captions
Hiya Roy, Toshihiko Yamasaki, Tatsuaki Hashimoto (UTokyo)
pp. 151 - 156

PRMU2020-96
[Short Paper] Accurate underwater model based dataset and analysis
Shunsuke Takao (PARI)
p. 157

PRMU2020-97
An approach for predicting traffic accidents at intersections with 360 degree panorama images
Daiki Tanaka, Kiyoharu Aizawa (The Univ. of Tokyo)
pp. 158 - 163

PRMU2020-98
Fine-Grained Image Recognition using Knowledge Graph base on Similarity between Concepts
Kazuhiro Kamada, Naoko Nitta, Kazuaki Nakamura, Noboru Babaguchi (Osaka Univ)
pp. 164 - 169

PRMU2020-99
Cross-view Non-local Neural Networks for Joint Representation Learning between First and Third Person Videos
Zhehao Zhu, Yusuke Sugano, Yoichi Sato (UTokyo)
pp. 170 - 175

PRMU2020-100
Towards Adversarial Robustness of Learning in the Frequency Domain
Subhajit Chaudhury, Toshihiko Yamasaki (UTokyo)
pp. 176 - 180

PRMU2020-101
A Basic Study on Automated Data Labeling for Machine Learning-based Local Image Features Matcher
Haruya Kyutoku, Tokihiko Akita, Seiichi Mita (Toyota Tech. Inst.)
pp. 181 - 186

Note: Each article is a technical report without peer review, and its polished version will be published elsewhere.

The Institute of Electronics, Information and Communication Engineers (IEICE), Japan

IEICE Technical Report

Volume 120, Number 409

Pattern Recognition and Media Understanding

Table of contents