IEICE Technical Report

Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380

Volume 116, Number 477

Speech

Workshop Date : 2017-03-01 - 2017-03-02 / Issue Date : 2017-02-22

[TOP] | [2013] | [2014] | [2015] | [2016] | [2017] | [2018] | [2019] | [Japanese] / [English]

SP2016-77
Speech waveform synthesis based on WaveNet considering speech generation process
Akira Tamamori, Tomoki Hayashi, Tomoki Toda, Kazuya Takeda (Nagoya Univ.)
pp. 1 - 6

SP2016-78
Nonaudible murmur enhancement based on non-negative tensor factorization with segment feature regularization in noisy environments
Yusuke Tajiri (Nagoya Univ.), Hirokazu Kameoka (NTT), Tomoki Toda (Nagoya Univ.)
pp. 7 - 12

SP2016-79
Noisy speech reconstruction based on deep neural network with optical microphone
Tomoyuki Mizuno, Takahiro Fukumori, Masato Nakayama, Takanobu Nishiura (Ritsumeikan Univ.)
pp. 13 - 18

SP2016-80
Missing Component Restoration for Speech Spectrogram Based on Time-domain Signal Estimation
Shogo Seki (Nagoya Univ.), Hirokazu Kameoka (NTT), Tomoki Toda, Kazuya Takeda (Nagoya Univ.)
pp. 19 - 24

SP2016-81
Study on tolerance of time axis fluctuation of pure white pseudonoisesignal1for impulse response measurement
Kentaro Mori, Yutaka Kaneda (Tokyo Denki Univ.)
pp. 25 - 30

SP2016-82
[Poster Presentation] Indoor-environmental sound identification based on deep neural network with higher-dimensional features
Sakiko Mishima, Yukoh Wakabayashi, Takahiro Fukumori, Masato Nakayama, Takanobu Nishiura (Ritsumeikan Univ.)
pp. 31 - 36

SP2016-83
[Poster Presentation] Feature analysis of electrocardiogram based on non-orthogonal wavelet expansions
Suehiro Shimauchi, Kana Eguchi, Toki Takeda, Ryosuke Aoki (NTT)
pp. 37 - 42

SP2016-84
[Poster Presentation] Conversion from linear microphone array signal to cylindrical binaural signal
Asuka Yamazato, Yoichi Haneda (UEC)
pp. 43 - 48

SP2016-85
[Poster Presentation] Application and Evaluation of CIP Methods to Acoustic Wave Propagation Analysis with Multi-dimensional Advection
Akihiro Fukuda, Kan Okubo (Tokyo Met. Univ.), Takuya Oshima (Niigata Univ.), Takao Tsuchiya (Doshisha Univ.), Masashi Kanamori (JAXA)
pp. 49 - 54

SP2016-86
[Poster Presentation] Comparison Analysis of Screeching Sound Using High-resolution Recording System -- Are different types of screeching sound similar to each other? --
Shuya Ogino, Yuka Manabe (Tokyo Met. Univ.), Kunio Hara (USC)), Kan Okubo (Tokyo Met. Univ.)
pp. 55 - 60

SP2016-87
[Poster Presentation] Analysis of Acoustic Characteristics of Wind Bells Using 24 bit/192 kHz High-resolution Measurement System
Fumikazu Saze, Yuto Oishi, Natsuhiko araki, Shun Kamikokura, Ryoya Kozai, Shuya Ogino, Yuka Manabe, Yuta Katori, Kan Okubo (Tokyo Met. Univ.)
pp. 61 - 66

SP2016-88
[Poster Presentation] Performance Evaluation of Initial Value Setting Method for Multi-channel NMF Using Single-channel NMF
Yu Tajima, Akira Tanaka (HU)
pp. 67 - 70

SP2016-89
[Poster Presentation] A Simple Self-Tuning Technique for Adaptive Proximal Forward-Backward Splitting
Kwangjin Jeong, Masahiro Yukawa (Keio Univ.), Masao Yamagishi, Isao Yamada (Tokyo Inst. Tech.)
pp. 71 - 76

SP2016-90
[Poster Presentation] Reflectance Spectra Estimation and Color Reproduction Based on Neugebauer Model
Kohei Inoue, Kenji Hara, Kiichi Urahama (Kyushu Univ.)
pp. 77 - 82

SP2016-91
[Poster Presentation] Improvement of the Similarity Calculation of B-Spline Open Curves by the Optimal Normalization
Yuuma Kubouchi, Akira Tanaka (Hokkaido Univ.)
pp. 83 - 86

SP2016-92
[Poster Presentation] On Radar Image Denoising with Complex Nonseparable Oversampled Lapped Transforms
Satoshi Nagayama, Shogo Muramatsu, Hiroyoshi Yamada (Niigata Univ.), Yuuichi Sugiyama (FUJITSU TEN)
pp. 87 - 91

SP2016-93
[Poster Presentation] Improvement Method for Removing Noise due to Magnetic Flux Trap in HTS-SQUID Magnetometers Based on Mean-Shift Clustering
Marina Taniguchi, Yuta Katori, Kan Okubo (TMU), Nobunao Takeuchi (THU), Kiyoshi Nishikawa (TMU)
pp. 93 - 98

SP2016-94
[Poster Presentation] GPU Implementation of Blur-Based Object Detection Using Spatial Domain Filtering
Shuhei Aoki, Shingo Kobayashi, Ryusuke Miyamoto (Meiji Univ.)
pp. 99 - 102

SP2016-95
[Poster Presentation] Implementation and Evaluation of Cursor Moving Interface Using Electrooculogram
Shohei Ogai, Toshihisa Tanaka (TUAT)
pp. 103 - 108

SP2016-96
[Poster Presentation] A Study on Magnetic Fluctuation Estimation Using Observation Data of Orthogonal Ternary Geomagnetic Field
Mami Sekigawa, Kan Okubo (TMU), Nobunao Takeuchi (THU), Kiyoshi Nishikawa (TMU)
pp. 109 - 114

SP2016-97
[Poster Presentation] Dual-Sparsification of Kernel Regression Based on Sampling
Atsushi Kojima, Toshihisa Tanaka (TUAT)
pp. 115 - 118

SP2016-98
[Poster Presentation] Estimation of Music Genres from Spontaneous Brain Activity Analysis by Using Neural Network
Hiroki Itoga, Yoshikazu Washizawa (UEC)
pp. 119 - 122

SP2016-99
[Poster Presentation] Representation Method Using Hermite Interpolating Polynomials and Compact Finite Difference for Natural Spline Interpolation and its Application
Hotaka Maruyama, Kan Okubo, Norio Tagawa (Tokyo Met. Univ.)
pp. 123 - 127

SP2016-100
[Poster Presentation] Estimation of playing position from music and speech sources based on music database
Satoshi Inui, Toru Takahashi (OSU)
pp. 129 - 134

SP2016-101
[Poster Presentation] Influence of the Fletcher effect, the Lombard effect and the high-pass filtered auditory feedback on singing voice
Satoshi Iijima, Shunsuke Ishimitsu, Masashi Nakayama (Hiroshima City Univ.)
pp. 135 - 140

SP2016-102
[Poster Presentation] Reverberant speech enhancement with deep auto encoder based on harmonic structure
Rikuto Ota, Yukoh Wakabayashi, Takahiro Fukumori, Masato Nakayama, Takanobu Nishiura (Ritsumeikan Univ.)
pp. 141 - 146

SP2016-103
[Poster Presentation] An investigation of speaker adaptation method for DNN-based speech synthesis using speaker codes
Nobukatsu Hojo, Yusuke Ijima (NTT)
pp. 147 - 152

SP2016-104
[Poster Presentation] Prosodic Word Embeddings for DNN-based speech synthesis
Yusuke Ijima, Nobukatsu Hojo, Ryo Masumura, Taichi Asami (NTT)
pp. 153 - 158

SP2016-105
TDOA Estimation Based on Phase-Voting Cross Correlation and Circular Standard Deviation
Masanori Kato, Yuzo Senda, Reishi Kondo (NEC)
pp. 159 - 164

SP2016-106
Image restoration based on weighted average of multiple blurred and noisy images
Ryo Tanikawa, Takanori Fujisawa, Masaaki Ikehara (Keio Univ.)
pp. 165 - 170

SP2016-107
Study on a Reduction of Calculated Amount in a Time-Domain Blind Source Separation
Tsubasa Inoue (NIT)
pp. 171 - 176

SP2016-108
[Invited Talk] Multikernel Adaptive Filtering: Signal Processing and Machine Learning
Masahiro Yukawa (Keio Univ.)
pp. 177 - 182

SP2016-109
[Invited Talk] An Introduction to Example-based Speech Enhancement and Its Improvements
Atsunori Ogawa, Keisuke Kinoshita, Marc Delcroix, Tomohiro Nakatani (NTT)
pp. 183 - 188

SP2016-110
[Poster Presentation] Fast Approximate Joint Diagonalization for Convolutive Blind Speech Separation
Toshiki Mori, Shinya Saito (TUS), Kunio Oishi (Tokyo Univ. of Tech.), Tosihiro Furukawa (TUS)
pp. 189 - 194

SP2016-111
[Poster Presentation] Study of room acoustic characteristics calculation from an impulse response measured at high sound pressure
Ryo Takebayashi, Yutaka Kaneda (Tokyo Denki Univ.)
pp. 195 - 200

SP2016-112
[Poster Presentation] Study on the noise reduction effect of band-limited impulse response measurement signal
Kouta Motegi, Yutaka Kaneda (Tokyo Denki Univ.)
pp. 201 - 206

SP2016-113
[Poster Presentation] Development of a communication system for smartphones using information hiding in audio signal
Chihiro Terayama, Niitsuma Masahiro, Yamashita Yoichi (Ritsumeikan Univ.)
pp. 207 - 212

SP2016-114
[Poster Presentation] Three-dimensional directivity control based on circular harmonic modes using a circular loudspeaker array
Koya Sato, Yoichi Haneda (UEC)
pp. 213 - 218

SP2016-115
[Poster Presentation] Sound localization using shoulder-type wearable loudspeaker with end-fire array
Imaizumi Kenta, Yoichi Haneda (UEC)
pp. 219 - 224

SP2016-116
[Poster Presentation] Network-oriented virtual auditory display system based on edge computing
Shuhei Ito, Yukio Iwaya (Tohoku Gakuin Univ.), Makoto Otani (Kyoto Univ.), Takao Tsuchiya (Doshisha Univ.)
pp. 225 - 226

SP2016-117
[Poster Presentation] Convergence rate analysis of stereo echo canceller with pre-processing units in both channels
Arata Honda, Kazushi Ikeda (NAIST)
pp. 227 - 230

SP2016-118
[Poster Presentation] Beat Noise Canceling Based on Adaptive Line Enhancer for FM Radio in Motor Vehicles
Takahiro Yamashita, Arata Kawamura, Youji Iiguni (Osaka Univ.)
pp. 231 - 236

SP2016-119
[Poster Presentation] Switchable Adaptive Feedback Canceller for Hearing Aids
Kakeru Kashima, Arata Kawamura (Osaka Univ.), Masahiro Sunohara, Kazuteru Nishiyama, Nobuhiko Hiruma (Rion Co., Ltd.), Youji Iiguni (Osaka Univ.)
pp. 237 - 242

SP2016-120
[Poster Presentation] Realization of a Headrest ANC System
Shoma Edamoto (Kansai Univ.), Chuang Shi (NTU), Yoshinobu Kajikawa (Kansai Univ.)
pp. 243 - 248

SP2016-121
[Poster Presentation] An evaluation of voice intelligibility in factory noise environment based on active noise control and auditory masking
Rumi Ito, Takahiro Fukumori, Masato Nakayama, Takanobu Nishiura (Ritsumeikan Univ.)
pp. 249 - 254

SP2016-122
[Poster Presentation] Parameter estimation method for mirror filter based on quadratically constrained quadratic optimization -- A study on a estimation using measured displacement of the diaphragm --
Kenta Iwai (Kansai Univ.), Masao Yamagishi (Tokyo Tech), Yoshinobu Kajikawa (Kansai Univ.)
pp. 255 - 260

SP2016-123
[Poster Presentation] An adaptive ARMA fitting model for conventional room transfer function a comparison study
Chibana Kengo, Bruno Senzio Savino Barzel (Ryukyu Univ)
pp. 261 - 265

SP2016-124
[Poster Presentation] NLMS algorithm using shift operation
Takumi Miyake, Yoshinobu Kajikawa (Kansai Univ.)
pp. 267 - 270

SP2016-125
[Poster Presentation] Spatial propagation analysis of indoor parametric array
Ryosuke Imamoto (Kansai Univ.), Chuang Shi (NTU), Yoshinobu Kajikawa (Kansai Univ.)
pp. 271 - 276

SP2016-126
[Poster Presentation] Study of branch selecting DNN acoustic model for robustness to environmental variation
Takafumi Moriya, Taichi Asami, Yoshikazu Yamaguchi, Yushi Aono (NTT)
pp. 277 - 282

SP2016-127
[Poster Presentation] Performance evaluation of noisy shouted speech detection based on acoustic model with rahmonic and mel-frequency cepstrum coefficients
Takahiro Fukumori, Masato Nakayama, Takanobu Nishiura (Ritsumeikan Univ.), Hiroaki Nanjo (Kyoto Univ.)
pp. 283 - 286

SP2016-128
[Poster Presentation] Use of the end of sentence and speaker-derived information in recurrent neural network language models for multiparty conversations.
Hiroto Ashikawa, Naohiro Tawara (Waseda Univ.), Atsunori Ogawa, Tomoharu Iwata (NTT), Tetsuji Ogawa, Tetsunori Kobayashi (Waseda Univ.)
pp. 287 - 290

SP2016-129
[Poster Presentation] Acoustic-to-articulatory inversion mapping with variational latent trajectory Gaussian mixture model
Patrick Lumban Tobing (Nagoya Univ.), Hirokazu Kameoka (NTT), Tomoki Toda (Nagoya Univ.)
pp. 291 - 296

SP2016-130
[Poster Presentation] Hardware Speech Sensor Based on Deep Neural Network Feature Extractor and Template Matching
Yi Liu, Boyu Qian, Jian Wang, Takahiro Shinozaki (Titech)
pp. 297 - 300

SP2016-131
[Poster Presentation] Individuality-Preserving HMM Sound Synthesis System for Articulation Disorders
Reina Ueda (Kobe Univ.), Tetsuya Takiguchi (Kobe Univ./JST PRESTO), Yasuo Ariki (Kobe Univ.)
pp. 301 - 306

SP2016-132
[Poster Presentation] Statistical Voice Conversion Including Duration for Dytharthric Speech
Ryo Aihara, Tetsuya Takigichi, Yasuo Ariki (Kobe Univ.)
pp. 307 - 312

SP2016-133
[Special Invited Talk] Speech and Audio Coding for High-Quality Services of Mobile-Phone and Broadcasting
Takehiro Moriya (NTT)
p. 313

SP2016-134
Non-native speech conversion with consistency-aware recursive network and generative adversarial network
Keisuke Oyamada (Univ. of Tsukuba), Hirokazu Kameoka, Takuhiro Kaneko (NTT), Hiroyasu Ando (Univ. of Tsukuba), Kaoru Hiramatsu, Kunio Kashino (NTT)
pp. 315 - 320

SP2016-135
Feature Extraction Using Adaptive Restricted Boltzmann Machine for Dysarthric Speech Recognition
Yuki Takashima (Kobe Univ.), Toru Nakashika (UEC), Tetsuya Takiguchi, Yasuo Ariki (Kobe Univ.)
pp. 321 - 326

SP2016-136
An Efficient Approximate Joint Diagonalization Algorithm and its Application to Blind Source Separation
Shinya Saito (Tokyo Univ. of Science), Kunio Oishi (Tokyo Univ. of Tech.), Toshihiro Furukawa (Tokyo Univ. of Science)
pp. 327 - 332

SP2016-137
Reproduction method of 22.2 multichannel sound in noisy environment considering inter-channel correlation
Shu Kitajima, Takehiro Sugimoto, Kazuho Ono (NHK)
pp. 333 - 338

SP2016-138
Multiple sound zone generation by using multi-point control method in real environment
Kazuya Yasueda, Daishuke Shinjo, Akitoshi Kataoka (Ryukoku Univ.)
pp. 339 - 344

SP2016-139
Distance Distinction Using Variance of Phase Difference for Source Signals in Same Direction
Tomoyasu Uchiyama, Arata Kawamura (Osaka Univ.), Youichi Fujisaka, Nobuhiko Hiruma (Rion Co.,Ltd.), Youji Iiguni (Osaka Univ.)
pp. 345 - 350

SP2016-140
Speech enhancement with phase reconstruction using phase distortion in harmonic frequency
Yukoh Wakabayashi, Takahiro Fukumori, Masato Nakayama, Takanobu Nishiura, Yoichi Yamashita (Ritsumeikan Univ.)
pp. 351 - 356

SP2016-141
A Method of Reducing Discomfort in Acoustic Communication using Phase Modulation by Processing per Subcarrier
Yuichi Sato, Hitoshi Aida (UTokyo)
pp. 357 - 362

Note: Each article is a technical report without peer review, and its polished version will be published elsewhere.

The Institute of Electronics, Information and Communication Engineers (IEICE), Japan

IEICE Technical Report

Volume 116, Number 477

Speech

Table of contents