講演名 | 2003/3/20 話者認識技術を応用した知覚的年齢分布の自動推定(聴覚,音声,言語とその障害) 山内 景太, 峯松 信明, 広瀬 啓吉, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本研究ではまず,広い年代の話者を含む音声データベースに対する聴取実験によって,各話者の知覚的年齢を推定した.次にデータベースの各話者を混合ガウス分布モデルを用いてモデル化した.未知入力話者の知覚的年齢を,各話者モデルに対する尤度を重みとして用い,聴取実験を通して定義された各話者の知覚的年齢の期待値操作によって推定することを試みた.ここで,各話者の知覚的年齢は,聴取者間で平均値をとることにより一つの値として表現することも可能であるが,聴取実験によりその分布が得られている.そこで各話者の知覚的年齢を,ラベルとして与える場合と,分布として与える場合について検討した.実験の結果,いずれの方法でも知覚的年齢と自動推定年齢間の相関値は約0.9となったが,分布として与えた場合により高い精度で推定される様子が観測された. |
抄録(英) | This paper proposes a new technique to estimate perceptual age of a speaker by using speaker recognition techniques. Firstly, listening experiments were carried out to define perceptual age of speakers in a database, who covered a wide range of real age. Next, every speaker in the database was modeled as GMM. Estimation of the perceptual age of an unknown speaker was done by expecting the perceptual age of all the speakers in the database, where likelihood scores calculated by matching the GMMs with the input speaker were used as weights. Perceptual age of every speaker in the database can be defined either as a value of age or a distribution of age. In this work, both definitions were compared experimentally. Correlation between the perceptual age defined by listening and that estimated by machines were approximately 0.9 in both cases. But some benefits were found in the experiments when the perceptual age was modeled as a distribution. |
キーワード(和) | 知覚的年齢 / 聴取実験 / 年齢分布 / 話者認識 / 期待値操作 / 知覚的インターフェイス |
キーワード(英) | perceptual age / listening experiment / age distributions / speaker recognition / expectation / PUI |
資料番号 | SP2002-186 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2003/3/20(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | JPN |
タイトル(和) | 話者認識技術を応用した知覚的年齢分布の自動推定(聴覚,音声,言語とその障害) |
サブタイトル(和) | |
タイトル(英) | Estimation of perceptual age distributions using speaker recognition techniques |
サブタイトル(和) | |
キーワード(1)(和/英) | 知覚的年齢 / perceptual age |
キーワード(2)(和/英) | 聴取実験 / listening experiment |
キーワード(3)(和/英) | 年齢分布 / age distributions |
キーワード(4)(和/英) | 話者認識 / speaker recognition |
キーワード(5)(和/英) | 期待値操作 / expectation |
キーワード(6)(和/英) | 知覚的インターフェイス / PUI |
第 1 著者 氏名(和/英) | 山内 景太 / Keita YAMAUCHI |
第 1 著者 所属(和/英) | 東京大学工学部 Faculty of Engineering, University of Tokyo |
第 2 著者 氏名(和/英) | 峯松 信明 / Nobuaki MINEMATSU |
第 2 著者 所属(和/英) | 東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, University of Tokyo |
第 3 著者 氏名(和/英) | 広瀬 啓吉 / Keikichi HIROSE |
第 3 著者 所属(和/英) | 東京大学大学院新領域創成科学研究科 Graduate School of Frontier Sciences, University of Tokyo |
発表年月日 | 2003/3/20 |
資料番号 | SP2002-186 |
巻番号(vol) | vol.102 |
号番号(no) | 749 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |