講演名 2010-10-09
Buried Markov Modelを用いた構音障害者の音声認識の検討(テーマセッション,福祉と見守りのための画像・音声処理)
宮本 千琴, 駒井 祐人, 滝口 哲也, 有木 康雄, 李 義昭,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声認識技術は現在,様々な環境下や場面において使用される機会が増加している.しかし,言語障害などの障害者を対象としたものは非常に少ない.本稿では,アテトーゼ型脳性麻痺による構音障害者の音声認識の検討を行う.アテトーゼ型の構音障害者の場合,筋肉の緊張のため発話が不安定になりやすい.これに対し,本研究では,時間変化による依存関係を考慮することで,不安定な発話に対する音声認識精度の改善を試みる.従来用いられているHMMによる音声認識は,はっきりと発話された音声に対しては高い精度で認識を行うことができるが,複雑な事象を表現するには適しておらず,雑音を含む音声や,連続的に発話された音声を認識する際には,精度が著しく低下する.この問題に対し,過去の観測と現在の観測の間の依存関係を表現できる確率モデルであるBuried Markov Modelを用いた音声認識モデルが,J.Bilmesによって提案された.本研究では,構音障害者の音声認識の実現に向けて,このBuried Markov Modelを用いて時間的依存関係を考慮し,音声認識精度の向上を目指す.
抄録(英) Recently, the accuracy of speaker-independent speech recognition has been remarkably improved by use of stochastic modeling of speech. However, there has been very little research on orally-challenged people, such as those with speech impediments. Therefore we have tried to build the acoustic model for a person with articulation disorders. The articulation of speech tends to become unstable due to strain on speech-related muscles, and that causes degradation of speech recognition. Therefore, we consider temporal dependence to solve this problem. Though HMM makes it possible to recognize clear utterance with high accuracy, the speech including the noise or the continuous utterance causes degradation of speech recognition. To solve this problem, J. Bilmes proposed buried Markov model which contains the conditional independence between the observation nodes. In this paper, we perform phone recognition experiments using buried Markov model.
キーワード(和) 構音障害 / Buried Markov Model
キーワード(英) articulation disorders / Buried Markov Model
資料番号 PRMU2010-101,SP2010-57,WIT2010-45
発行日

研究会情報
研究会 WIT
開催期間 2010/10/1(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Well-being Information Technology(WIT)
本文の言語 JPN
タイトル(和) Buried Markov Modelを用いた構音障害者の音声認識の検討(テーマセッション,福祉と見守りのための画像・音声処理)
サブタイトル(和)
タイトル(英) A Study on Dysarthric Speech Recognition using Buried Markov Model
サブタイトル(和)
キーワード(1)(和/英) 構音障害 / articulation disorders
キーワード(2)(和/英) Buried Markov Model / Buried Markov Model
第 1 著者 氏名(和/英) 宮本 千琴 / Chikoto MIYAMOTO
第 1 著者 所属(和/英) 神戸大学工学研究科
Graduate School of Engineering, Kobe University
第 2 著者 氏名(和/英) 駒井 祐人 / Yuto KOMAI
第 2 著者 所属(和/英) 神戸大学工学研究科
Graduate School of Engineering, Kobe University
第 3 著者 氏名(和/英) 滝口 哲也 / Tetsuya TAKIGUCHI
第 3 著者 所属(和/英) 神戸大学工学研究科
Graduate School of Engineering, Kobe University
第 4 著者 氏名(和/英) 有木 康雄 / Yasuo ARIKI
第 4 著者 所属(和/英) 神戸大学工学研究科
Graduate School of Engineering, Kobe University
第 5 著者 氏名(和/英) 李 義昭 / Ichao LI
第 5 著者 所属(和/英) 追手門学院大学経済学部
Faculty of Economics, Otemon Gakuin University
発表年月日 2010-10-09
資料番号 PRMU2010-101,SP2010-57,WIT2010-45
巻番号(vol) vol.110
号番号(no) 221
ページ範囲 pp.-
ページ数 6
発行日