電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2019-03-15 13:30
[ポスター講演]End-to-end構音障害者音声認識のための複数データベースを用いたデータ拡張
高島悠樹滝口哲也有木康雄神戸大
技報オンラインサービス実施中
抄録 (和) 本報告では,アテトーゼ型脳性麻痺による日本人構音障害者の音声認識を行う. 意図的な動作時や緊張状態にある場合に筋肉の不随意運動が生じるため,彼らの発話は不安定となる. そのため,一般的な音声認識システムでは彼らの発話を認識することは困難となる. 近年,深層学習の発展により様々な技術が提案されているが,そのほとんどは大量の学習データを必要とする. しかし,アテトーゼ型脳性麻痺による構音障害者は発話による身体への負担が大きいために,大量の学習データを用意することは困難である. そのため,限られた学習データ量で構築できるシステムが求められる. 本研究では,構音障害を持つ英語話者と日本人健常者の音声を用いたデータ拡張を提案する. また,本稿では,listen, attend and spell (LAS)モデルを用いたend-to-end音声認識を行う. LASモデルはenocder-decoderモデルであり,encoderが音響モデル,decoderが言語モデルに相当する. 音響モデルモジュールを構音障害を持つ英語話者と,言語モデルモジュールを日本人健常者と共有することにより,対象とする日本人構音障害者固有のパラメータを抑えたモデルを提案する.単語認識実験により,提案手法の有効性を確認した. 
(英) We present in this paper an end-to-end speech recognition system for a Japanese person with an articulation disorder resulting from athetoid cerebral palsy. The movements of such speakers are limited by their athetoid symptoms, and their utterances are often unstable or unclear, which makes it difficult for them to communicate. Therefore, the performance of automatic speech recognition (ASR) systems for people with an articulation disorder degrades significantly. Recently, deep learning approaches to speech recognition have seen much progress. These techniques require a large amount of training data, however, the amount of data from people with articulation disorder is limited due to their athetoid symptoms. This paper proposes a data augmentation method using not only the speech data of a Japanese person with an articulation disorder but also the speech data of a physically unimpaired Japanese person and a non-Japanese person with an articulation disorder. We employ an end-to-end ASR model based on the listen, attend and spell (LAS) model which has an acoustic module and a language module. In our proposed model, the acoustic module is shared between people with dysarthria, and a language module is assigned to each language regardless of dysarthria. The effectiveness of this approach was confirmed through word-recognition experiments where our proposed method outperformed a method based on the conventional LAS model.
キーワード (和) 音声認識 / マルチリンガル / 障害者支援 / end-to-endモデル / 構音障害 / / /  
(英) Speech recognition / Multilingual / Assistive technology / End-to-end model / Dysarthria / / /  
文献情報 信学技報, vol. 118, no. 497, SP2018-118, pp. 335-340, 2019年3月.
資料番号 SP2018-118 
発行日 2019-03-07 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 EA SIP SP  
開催期間 2019-03-14 - 2019-03-15 
開催地(和) アイランド ナガサキ(長崎市) 
開催地(英) i+Land nagasaki (Nagasaki-shi) 
テーマ(和) 応用/電気音響,信号処理,音声,一般 
テーマ(英) Engineering/Electro Acoustics, Signal Processing, Speech, and Related Topics 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2019-03-EA-SIP-SP 
本文の言語 日本語 
タイトル(和) End-to-end構音障害者音声認識のための複数データベースを用いたデータ拡張 
サブタイトル(和)  
タイトル(英) Data augmentation using multiple databases for end-to-end dysarthric speech recognition 
サブタイトル(英)  
キーワード(1)(和/英) 音声認識 / Speech recognition  
キーワード(2)(和/英) マルチリンガル / Multilingual  
キーワード(3)(和/英) 障害者支援 / Assistive technology  
キーワード(4)(和/英) end-to-endモデル / End-to-end model  
キーワード(5)(和/英) 構音障害 / Dysarthria  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 高島 悠樹 / Yuki Takashima / タカシマ ユウキ
第1著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.)
第2著者 氏名(和/英/ヨミ) 滝口 哲也 / Tetsuya Takiguchi / タキグチ テツヤ
第2著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.)
第3著者 氏名(和/英/ヨミ) 有木 康雄 / Yasuo Ariki / アリキ ヤスオ
第3著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2019-03-15 13:30:00 
発表時間 90 
申込先研究会 SP 
資料番号 IEICE-EA2018-156,IEICE-SIP2018-162,IEICE-SP2018-118 
巻番号(vol) IEICE-118 
号番号(no) no.495(EA), no.496(SIP), no.497(SP) 
ページ範囲 pp.335-340 
ページ数 IEICE-6 
発行日 IEICE-EA-2019-03-07,IEICE-SIP-2019-03-07,IEICE-SP-2019-03-07 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会