講演名 2009-07-17
ランダムプロジェクションを用いた音声特徴量変換(音響モデル,認識,理解,対話,一般)
吉井 麻里子, 滝口 哲也, 有木 康雄 /,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では、ランダムプロジェクションを用いた音声特徴量変換を提案する。ランダムプロジェクションとは,次元削減の手法として従来用いられており、高次元空間における任意の2点間のユークリッド距離が射影先の低次元空間においてもほぼ保存される,という性質を持つ空間写像の一手法である.ランダムプロジェクションで用いる写像行列は,各成分が独立にある確率分布に従うランダムなn×k行列として定義される.本稿では,複数のランダムマトリックスを用いて機械的に音声特徴量を変換し,各々のランダム写像に対する音声認識結果に投票を行い,最適な認識結果を求める.評価はCENSREC-3で行い,その有効性を示す.
抄録(英) This paper proposes a novel feature transformation method for speech recognition based on random projection. Random projection has been suggested as a means of dimensionality reduction, where the original data are projected onto a subspace using a random matrix. In this paper, we investigate the feasibility of random projection for speech feature extraction. Its effectiveness is confirmed by word recognition experiments on noisy speech.
キーワード(和) 音声特徴量変換 / ランダムプロジェクション / ランダム写像行列 / 音声認識
キーワード(英) feature transformation / random projection / random matrix / speech recognition
資料番号 SP2009-41
発行日

研究会情報
研究会 SP
開催期間 2009/7/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) ランダムプロジェクションを用いた音声特徴量変換(音響モデル,認識,理解,対話,一般)
サブタイトル(和)
タイトル(英) Random-Projection-Based Feature Transformation
サブタイトル(和)
キーワード(1)(和/英) 音声特徴量変換 / feature transformation
キーワード(2)(和/英) ランダムプロジェクション / random projection
キーワード(3)(和/英) ランダム写像行列 / random matrix
キーワード(4)(和/英) 音声認識 / speech recognition
第 1 著者 氏名(和/英) 吉井 麻里子 / Mariko YOSHII
第 1 著者 所属(和/英) 神戸大学大学院工学研究科
Graduate School of Engineering, Kobe University
第 2 著者 氏名(和/英) 滝口 哲也 / Tetsuya TAKIGUCHI
第 2 著者 所属(和/英) 神戸大学自然科学系先端融合研究環
Organization of Advanced Science and Technology, Kobe University
第 3 著者 氏名(和/英) 有木 康雄 / / Yasuo ARIKI
第 3 著者 所属(和/英) 神戸大学自然科学系先端融合研究環 /
Organization of Advanced Science and Technology, Kobe University
発表年月日 2009-07-17
資料番号 SP2009-41
巻番号(vol) vol.109
号番号(no) 139
ページ範囲 pp.-
ページ数 6
発行日