講演名 2001/11/8
Dempster-Shafer理論を用いた音声・画像情報の統合による個人認識システム
杉江 嘉昭, 小林 哲則,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 個人認識において, 音声と顔画像の複数情報をDempster-Shafer理論に基づき統合する新たな手法を提案し, この手法が棄却性能を含む総合的な個人認識性能を向上させる観点で有効であることを示す。従来の統合法は, 一般に音声, 画像の各単独情報の認識器において得られる尤度の重みつきの和によって統合尤度を算出し, この値のみを用いて認識結果を得るものが多い。ここで提案する手法は, 不確実量を扱えないというBayes確率の問題点を解決するために提案されたDempster-Shafer理論に基づき統合する方法である。Dempster-Shafer理論は, 数値化された複数の証拠を統合する魅力的な方法論であるが, 従来研究においては, 証拠を数値化する具体的で理にかなった方法が与えられていなかった。本研究では, この問題を正解カテゴリと不正解カテゴリの正規化尤度の累積密度分布関数をもとに証拠の数値化を行う新たな方法を提案する。実験の結果, 提案手法は, 従来の統合法に比べ18.0%認識率を改善できることを示す。
抄録(英) In this paper, we describe a new integration method of speech and facial image information for person recognition. We show that the integration of speech and facial image with Dempster-Shafer's theory is very effective to improve the total performance of media-integrated recognizer especially to improve the rejection performance. Conventional media-integrated recognizers adopt the simple sum of the normalized log-likelihood values of uni-modal Bayesian recognizers and use it alone for the decision. We modified the method based on Dempster-Shafer's theory to solve the problem of Bayesian probability that can't use uncertainty. Dempster-Shafer's theory gives the attractive ideas for the integration of numerical evidences, but there was no concrete and reasonable idea for enumerating the each evidence. We solved this problem by considering the cumulative density functions of normalized log-likelihood values of correct and incorrect categories. The experimental results shows that proposed method improves the recognition performance by 18.0% compared to conventional method.
キーワード(和) 個人認識 / Embedded HMM画像認識 / GMM話者認識 / 情報統合 / Dempster-Shafer理論
キーワード(英) Person recognition / Embedded HMM-based face recognition / GMM-based speaker recognition / Information integration / Dempster-Shafer theory
資料番号 PRMU2001-122,HIP2001-25,MVE2001-84
発行日

研究会情報
研究会 MVE
開催期間 2001/11/8(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Media Experience and Virtual Environment (MVE)
本文の言語 JPN
タイトル(和) Dempster-Shafer理論を用いた音声・画像情報の統合による個人認識システム
サブタイトル(和)
タイトル(英) Person recognition based on the integration of speech and facial image with Dempster-Shafer's theory
サブタイトル(和)
キーワード(1)(和/英) 個人認識 / Person recognition
キーワード(2)(和/英) Embedded HMM画像認識 / Embedded HMM-based face recognition
キーワード(3)(和/英) GMM話者認識 / GMM-based speaker recognition
キーワード(4)(和/英) 情報統合 / Information integration
キーワード(5)(和/英) Dempster-Shafer理論 / Dempster-Shafer theory
第 1 著者 氏名(和/英) 杉江 嘉昭 / Yoshiaki SUGIE
第 1 著者 所属(和/英) 早稲田大学理工学部電気電子情報工学科
Department of Electrical, Electronics & Computer Engineering Waseda University
第 2 著者 氏名(和/英) 小林 哲則 / Tetsunori KOBAYASHI
第 2 著者 所属(和/英) 早稲田大学理工学部電気電子情報工学科
Department of Electrical, Electronics & Computer Engineering Waseda University
発表年月日 2001/11/8
資料番号 PRMU2001-122,HIP2001-25,MVE2001-84
巻番号(vol) vol.101
号番号(no) 425
ページ範囲 pp.-
ページ数 6
発行日