講演抄録/キーワード |
講演名 |
2009-12-22 15:50
AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識 ○宮本千琴・駒井祐人・滝口哲也・有木康雄(神戸大)・李 義昭(追手門学院大)・中林稔堯(神戸大) NLC2009-29 SP2009-93 |
抄録 |
(和) |
本稿では,アテトーゼ型脳性麻痺による構音障害者の音声認識の検討を行う.アテトーゼ型の構音障害者の場合,筋肉の緊張のため発話が不安定になりやすく,発話時に頭が動いてしまう場合がある.これに対して,音声特徴としてデルタケプストラム係数のセグメント特徴量を用いる.また,発話時の頭部の動きに対しては,Active Appearance Model(AAM)を用いることで画像から顔方位にロバストな唇領域特徴を抽出し,音声特徴と共に用いることで,雑音の影響を受けず発話変動を考慮したマルチモーダル音声認識を検討する. |
(英) |
We investigated the speech recognition of a person with articulation disorders resulting from athetoid cerebral palsy. The articulation of speech tends to become unstable due to strain on speech-related muscles, and that causes degradation of speech recognition. Therefore, we use multiple acoustic frames as an acoustic feature to solve this problem. Further, in a real environment, the speech recognition systems do not have sufficient performance due to noise influence. In addition to acoustic features, visual features are used to increase noise robustness in a real environment. However, there is a recognition problem due to the tendency of his/her unsettling head movement. We investigate a pose-robust audio-visual speech recognition method using Active Appearance Model (AAM) to solve this problem. |
キーワード |
(和) |
構音障害 / マルチモーダル音声認識 / Active Appearance Model / / / / / |
(英) |
articulation disorders / audio-visual speech recognition / Active Appearance Model / / / / / |
文献情報 |
信学技報, vol. 109, no. 356, SP2009-93, pp. 195-200, 2009年12月. |
資料番号 |
SP2009-93 |
発行日 |
2009-12-14 (NLC, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2009-29 SP2009-93 |