講演抄録/キーワード |
講演名 |
2015-03-02 11:40
残響下音声認識におけるモデル学習用インパルス応答の最適化 ○福森隆寛・中山雅人・西浦敬信・山下洋一(立命館大) EA2014-78 SIP2014-119 SP2014-141 |
抄録 |
(和) |
実環境において音声認識システムを利用すると,残響などの影響を受けて音声認識性能が著しく劣化する.耐残響に関するアプローチの1つとして,残響音声を音響モデルの学習に用いる手法が広く研究されており,特に従来は残響時間が異なる環境の残響音声から音響モデルを構築する手法が利用されてきた.しかし,音声認識性能は発話者とマイクロホン間の位置関係に大きく依存するため,同一室内で固有の値を有する残響時間だけでは,適切な音響モデルの学習に限界があると考えられる.これまでに,我々は室内音響指標に基づいて残響下音声認識における音響モデルの学習法を提案した.提案手法では,発話者とマイクロホン間の位置関係に依存して変動する室内音響指標のD値に着目し,このD値が異なるインパルス応答を用いて音響モデルを構築することで,残響環境下で音声認識性能を改善させることができた.そこで本稿では,音響モデルの学習に用いるインパルス応答の最適化(具体的には,D値算出時の初期・後続反射音の境界時間,インパルス応答の数)に取り組んだ.評価実験結果より,残響時間とD50が異なる9ヶ所のインパルス応答を用いて残響マッチドな音響モデルを構築することで,高い音声認識性能を達成することができた. |
(英) |
The reverberant speech degrades the speech recognition performance in the field of distant-talking speech. As one of approaches against the reverberation, a method has been studied by constructing an acoustic model trained with the reverberant speech. There is, however, a problem that the reverberation time, which is an unique value in a room, has a limitation for an improvement of speech recognition performance because speech recognition performance greatly depends on the arrangement of a speaker and a microphone. To overcome this problem, we have already proposed a construction method of an optimum acoustic model based on D value. In this method, an acoustic model is constructed by using many impulse responses measured under the conditions with different D value. The proposed method could improve speech recognition performance in comparison with a conventional method. In this paper, we try to optimize impulse responses for training an acoustic model in terms of a border time of D value and a number of impulse responses. In evaluation experiments, we confirmed higher speech recognition performance by using nine impulse responses with different reverberation time and D50. |
キーワード |
(和) |
音声認識 / 残響 / 音響モデル / 室内音響指標 / / / / |
(英) |
Speech recognition / Reverberation / Acoustic model / Acoustic parameters / / / / |
文献情報 |
信学技報, vol. 114, no. 475, SP2014-141, pp. 37-42, 2015年3月. |
資料番号 |
SP2014-141 |
発行日 |
2015-02-23 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2014-78 SIP2014-119 SP2014-141 |
|