講演名 2003/3/20
話者認識技術を応用した知覚的年齢分布の自動推定(聴覚,音声,言語とその障害)
山内 景太, 峯松 信明, 広瀬 啓吉,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究ではまず,広い年代の話者を含む音声データベースに対する聴取実験によって,各話者の知覚的年齢を推定した.次にデータベースの各話者を混合ガウス分布モデルを用いてモデル化した.未知入力話者の知覚的年齢を,各話者モデルに対する尤度を重みとして用い,聴取実験を通して定義された各話者の知覚的年齢の期待値操作によって推定することを試みた.ここで,各話者の知覚的年齢は,聴取者間で平均値をとることにより一つの値として表現することも可能であるが,聴取実験によりその分布が得られている.そこで各話者の知覚的年齢を,ラベルとして与える場合と,分布として与える場合について検討した.実験の結果,いずれの方法でも知覚的年齢と自動推定年齢間の相関値は約0.9となったが,分布として与えた場合により高い精度で推定される様子が観測された.
抄録(英) This paper proposes a new technique to estimate perceptual age of a speaker by using speaker recognition techniques. Firstly, listening experiments were carried out to define perceptual age of speakers in a database, who covered a wide range of real age. Next, every speaker in the database was modeled as GMM. Estimation of the perceptual age of an unknown speaker was done by expecting the perceptual age of all the speakers in the database, where likelihood scores calculated by matching the GMMs with the input speaker were used as weights. Perceptual age of every speaker in the database can be defined either as a value of age or a distribution of age. In this work, both definitions were compared experimentally. Correlation between the perceptual age defined by listening and that estimated by machines were approximately 0.9 in both cases. But some benefits were found in the experiments when the perceptual age was modeled as a distribution.
キーワード(和) 知覚的年齢 / 聴取実験 / 年齢分布 / 話者認識 / 期待値操作 / 知覚的インターフェイス
キーワード(英) perceptual age / listening experiment / age distributions / speaker recognition / expectation / PUI
資料番号 SP2002-186
発行日

研究会情報
研究会 SP
開催期間 2003/3/20(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 話者認識技術を応用した知覚的年齢分布の自動推定(聴覚,音声,言語とその障害)
サブタイトル(和)
タイトル(英) Estimation of perceptual age distributions using speaker recognition techniques
サブタイトル(和)
キーワード(1)(和/英) 知覚的年齢 / perceptual age
キーワード(2)(和/英) 聴取実験 / listening experiment
キーワード(3)(和/英) 年齢分布 / age distributions
キーワード(4)(和/英) 話者認識 / speaker recognition
キーワード(5)(和/英) 期待値操作 / expectation
キーワード(6)(和/英) 知覚的インターフェイス / PUI
第 1 著者 氏名(和/英) 山内 景太 / Keita YAMAUCHI
第 1 著者 所属(和/英) 東京大学工学部
Faculty of Engineering, University of Tokyo
第 2 著者 氏名(和/英) 峯松 信明 / Nobuaki MINEMATSU
第 2 著者 所属(和/英) 東京大学大学院情報理工学系研究科
Graduate School of Information Science and Technology, University of Tokyo
第 3 著者 氏名(和/英) 広瀬 啓吉 / Keikichi HIROSE
第 3 著者 所属(和/英) 東京大学大学院新領域創成科学研究科
Graduate School of Frontier Sciences, University of Tokyo
発表年月日 2003/3/20
資料番号 SP2002-186
巻番号(vol) vol.102
号番号(no) 749
ページ範囲 pp.-
ページ数 6
発行日