IEICE Technical Report

Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380

Speech

Workshop Date : 2018-01-20 - 2018-01-21 / Issue Date : 2018-01-13

SP2017-66
An extended log domain pulse model for VOCODERs
Hideki Kawahara (Wakayama Univ.)
pp. 1 - 4

SP2017-67
A study on statistical speech synthesis based on GP-DNN hybrid model
Tomoki Koriyama, Takao Kobayashi (Tokyo Tech)
pp. 5 - 10

SP2017-68
DNN Based Voice Conversion Method Considering Outputs of Multiple Networks
Takuya Fujioka, Sun Qinghua (Hitachi)
pp. 11 - 15

SP2017-69
Searching for the Origin of Natural Language Processing -- Automata, Telepathy Communication and Schizophrenia --
Makoto Koike (MK Microwave)
pp. 17 - 25

SP2017-70
[Poster Presentation] A study on the articulatory-to-speech conversion by using deep learning
Fumiaki Taguchi, Tokihiko Kaburagi (Kyushu Univ.)
pp. 27 - 30

SP2017-71
[Poster Presentation] Automatic speech quality control of English listening materials and examination of Japanese learners’ listening ability in terms of robustness
Zhang Haoyu, Inoue Yusuke, Saito Daisuke, Minematsu Nobuaki (UTokyo), Yamauchi Yutaka (TIU), Masuda Hinako (SeikeiU)
pp. 31 - 34

SP2017-72
[Poster Presentation] Influence of frame shift in speech parameters on sound quality by high-quality speech analysis/synthesis system
Genta Miyashita, Masanori Morise (Yamanashi Univ.)
pp. 35 - 38

SP2017-73
[Poster Presentation] Analysis of timbre changes caused by expressing fatigue speech
Takuro Shono, Masanori Morise (Yamanashi Univ.)
pp. 39 - 42

SP2017-74
[Poster Presentation] TRAJECTORY TRAINING CONSIDERING POWER FOR SPEECH SYNTHESIS BASED ON NEURAL NETWORKS
Ryohei Funato, Kei Hashimoto, keiichiro Oura, Yoshihiko Nankaku, Keiichi Tokuda (Nagoya Inst. of Tech.)
pp. 43 - 48

SP2017-75
[Invited Talk] Investigation of the mechanisms of speech communication by brain science
Sadao Hiroya (NTT)
pp. 49 - 54

SP2017-76
Perception Boundary of Singleton and Geminate Stops by Japanese and Taiwanese Mandarin Speakers
Shigeaki Amano (Aichi Shukutoku Univ.), Kimiko Ymakawa (Shokei Univ.)
pp. 55 - 60

SP2017-77
Brain activity during voicing perception in stop consonants -- A magnetoencephalography study --
Shunsuke Tamura, Kazuhito Ito, Naruhito Hironaga, Takako Mitsudo, Nobuyuki Hirose, Shuji Mori (Kyusyu Univ.)
pp. 61 - 66

SP2017-78
Survey on awareness and actual conditions of clumsy speaking
Tatsuya Kitamura (Konan Univ.), Yukiko Nota (ATR), Michiko Hashi (Prefectural Univ. of Hiroshima), Hironori Takemoto (Chiba Inst. of Technology)
pp. 67 - 72

SP2017-79
Auditory spatial attention affects word intelligibility in noisy environment
Ryo Teraoka, Shuichi Sakamoto, Zhenglie Cui, Yoiti Suzuki, Satoshi Shioiri (Tohoku Univ.)
pp. 73 - 77

SP2017-80
[Invited Talk] Impact of WaveNet on Speech Synthesis Research
Tomoki Toda (Nagoya Univ./JST)
p. 79

SP2017-81
An investigation of multi-speaker WaveNet vocoder
Tomoki Hayashi, Kazuhiro Kobayashi, Akira Tamamori, Kazuya Takeda, Tomoki Toda (Nagoya Univ.)
pp. 81 - 86

SP2017-82
Statistical voice conversion with WaveNet vocoder
Kazuhiro Kobayashi, Tomoki Hayashi, Akira Tamamori, Tomoki Toda (Nagoya Univ.)
pp. 87 - 92

SP2017-83
Mel-cepstrum based quantization noise shaping applied to speech synthesis based on WaveNet
Takenori Yoshimura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, Keiichi Tokuda (Nagoya Inst. of Tech.)
pp. 93 - 98

SP2017-84
A study on voice conversion based on WaveNet
Jumpei Niwa, Takenori Yoshimura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, Keiichi Tokuda (NIT)
pp. 99 - 104

Note: Each article is a technical report without peer review, and its polished version will be published elsewhere.

The Institute of Electronics, Information and Communication Engineers (IEICE), Japan