講演名 2020-06-04
An experimental comparison of CNN- and CRNN-CTC for automatic phrase speech recognition systems using a children's speech database
王 云テツ(北大), 田 雨(北大), 宮永 喜一(千歳科技大), 筒井 弘(北大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和)
抄録(英) Children's speech recognition is still a challenging issue. In the case of children's speeches, the accuracy of conventional phrase speech recognition approaches is significantly low. This is mainly owing to the high variability of pronunciation patterns due to children's physical activity. Motivated by this, in this paper, we present a phrase speech recognition system using neural networks. We use a convolutional neural network (CNNs) and its recurrent neural network (RNN) version, say CRNN. Also, both approaches utilize a connectionist temporal classification (CTC) loss function, which allows networks to be trained without any prior alignment. Through experiments using a children's speech database, we show the comparison results of CNN- and CRNN-CTC approaches.
キーワード(和)
キーワード(英) Children's speech recognitionconvolutional recurrent neural network (CRNN)connectionist temporal classification (CTC)
資料番号 SIS2020-9
発行日 2020-05-27 (SIS)

研究会情報
研究会 SIS / IPSJ-AVM / ITE-3DIT
開催期間 2020/6/3(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 知的マルチメディアシステム, 組込み応用システム, 立体映像技術, 一般
テーマ(英) Intelligent Multimedia Systems, Applied Enbedded Systems, Three-Dimensional Image Technology (3DIT), etc.
委員長氏名(和) 末竹 規哲(山口大) / 内藤 整(KDDI総合研究所) / 陶山 史朗(徳島大)
委員長氏名(英) Noriaki Suetake(Yamaguchi Univ.) / Sei Naito(KDDI Research, Inc.) / Shiro Suyama(Tokushima Univ.)
副委員長氏名(和) 木村 誠聡(神奈川工科大) / 笹岡 直人(鳥取大)
副委員長氏名(英) Tomoaki Kimura(Kanagawa Inst. of Tech.) / Naoto Sasaoka(Tottori Univ.)
幹事氏名(和) 古賀 崇了(近畿大) / 三澤 秀明(宇部高専) / 松村 誠明(NTT) / 金井 謙治(早稲田大学) / 徐 建鋒(KDDI総合研究所) / 堀越 力(湘南工科大) / 上原 伸一(AGC)
幹事氏名(英) Takanori Koga(Kindai Univ.) / Hideaki Misawa(National Inst. of Tech., Ube College) / Masaaki Matsumura(NTT) / Kenji Kanai(Waseda Univ.) / Xu Jianfeng(KDDI Research, Inc.) / Tsutomu Horikoshi(Shonan Institute of Technologynki Univ.) / Shinich Uehara(AGC)
幹事補佐氏名(和) 坂東 幸浩(NTT) / 吉田 壮(関西大学)
幹事補佐氏名(英) Yukihiro Bandoh(NTT) / Soh Yoshida(Kansai Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Smart Info-Media Systems / Special Interest Group on Audio Visual and Multimedia Information Processing / Technical Group on Three-Dimensional Image Technology
本文の言語 ENG
タイトル(和)
サブタイトル(和)
タイトル(英) An experimental comparison of CNN- and CRNN-CTC for automatic phrase speech recognition systems using a children's speech database
サブタイトル(和)
キーワード(1)(和/英) / Children's speech recognitionconvolutional recurrent neural network (CRNN)connectionist temporal classification (CTC)
第 1 著者 氏名(和/英) 王 云テツ / Yunzhe Wang
第 1 著者 所属(和/英) 北海道大学(略称:北大)
Hokkaido University(略称:Hokkaido Univ.)
第 2 著者 氏名(和/英) 田 雨 / Yu Tian
第 2 著者 所属(和/英) 北海道大学(略称:北大)
Hokkaido University(略称:Hokkaido Univ.)
第 3 著者 氏名(和/英) 宮永 喜一 / Yoshikazu Miyanaga
第 3 著者 所属(和/英) 千歳科学技術大学(略称:千歳科技大)
Chitose Institute of Science and Technology(略称:CIST)
第 4 著者 氏名(和/英) 筒井 弘 / Hiroshi Tsutsui
第 4 著者 所属(和/英) 北海道大学(略称:北大)
Hokkaido University(略称:Hokkaido Univ.)
発表年月日 2020-06-04
資料番号 SIS2020-9
巻番号(vol) vol.120
号番号(no) SIS-51
ページ範囲 pp.49-54(SIS),
ページ数 6
発行日 2020-05-27 (SIS)