講演名 2014/12/8
年齢・性別に依存しないDNN-HMMによる音声認識法の検討(ポスター・デモセッション,第16回音声言語シンポジウム)
関 博史, 山本 一公, 中川 聖一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々は,従来から音節単位音響モデリングについて研究を行っている.そこで本研究では,まず音節単位および音素単位DNN-HMMを構築し,これらの認識精度について調査を行った.その結果,triphone,コンテキスト独立音節いずれもほぼ等しい認識精度を示した.次に,3つの年齢層(成人・老人・子供)と性別(男性・女性)ごとに計6つのクラスの学習データを用意し,年齢・性別に依存しないDNN-HMMの検討を行った.一般的に,不特定話者を対象とした音声認識システムは,話者特定システムに比べ,認識性能が低下してしまう.しかしクラス毎に特徴量を正規化することで,すべてのクラスを用いて一つのモデルを学習した場合でも,クラスごとにDNN-HMMを学習したモデルを上回る認識精度を得ることが出来た.最後に,クラス情報のネットワークへの組み込みを検討した.
抄録(英) We have studied syllable-based acoustic modeling for Japanese speech recognition. In this paper, we first investigate the performance of recognition accuracy using phoneme/syllable-based DNN-HMM. The results show that there's no significant difference between phoneme/syllable-based DNN-HMM. Second, we investigate the age- and gender-independent speech recognition using DNN-HMM. We use three types of corpora(adult, elder, child), and each corpus contains male and female speech data. In general, speaker-independent system cannot handle the specific information of speakers, and the recognition performance of speaker independent model is lower that of speaker dependent model. Our experimental results show that one DNN-HMM trained by all corpora with a class-dependent feature normalization method achieves better performance compared to class-dependent DNN-HMMs. Finally, we investigate the incorporation of information on corpora into DNN.
キーワード(和) ディープニューラルネットワーク / HMM / DNN-HMM / 不特定話者音声認識
キーワード(英) Deep Neural Network / HMM / DNN-HMM / speaker independent speech recognition
資料番号 Vol.2014-SLP-104 No.29
発行日

研究会情報
研究会 SP
開催期間 2014/12/8(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 年齢・性別に依存しないDNN-HMMによる音声認識法の検討(ポスター・デモセッション,第16回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Consideration on Age- and Gender-independent Speech Recognition using DNN-HMM
サブタイトル(和)
キーワード(1)(和/英) ディープニューラルネットワーク / Deep Neural Network
キーワード(2)(和/英) HMM / HMM
キーワード(3)(和/英) DNN-HMM / DNN-HMM
キーワード(4)(和/英) 不特定話者音声認識 / speaker independent speech recognition
第 1 著者 氏名(和/英) 関 博史 / HIROSHI SEKI
第 1 著者 所属(和/英) 豊橋技術科学大学
Toyohashi University of Technology
第 2 著者 氏名(和/英) 山本 一公 / KAZUMASA YAMAMOTO
第 2 著者 所属(和/英) 豊橋技術科学大学
Toyohashi University of Technology
第 3 著者 氏名(和/英) 中川 聖一 / SEIICHI NAKAGAWA
第 3 著者 所属(和/英) 豊橋技術科学大学
Toyohashi University of Technology
発表年月日 2014/12/8
資料番号 Vol.2014-SLP-104 No.29
巻番号(vol) vol.114
号番号(no) 365
ページ範囲 pp.-
ページ数 6
発行日