電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2012-03-12 11:25
階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング
俵 直弘小川哲司早大)・渡部晋治NTT/MERL)・中村 篤NTT)・小林哲則早大
抄録 (和) 階層的構造を持つフルベイズ発話生成モデルを定式化し,このモデルの構造を推定することで,複数人により発話された音声データに対して話者クラスタリングと話者数の推定を同時に行う手法を提案する.提案手法では,話者の分布として混合ガウス分布を導入し,これら話者分布を混合要素としてもつ階層的な混合モデルとして発話生成モデルを定式化する.このとき,このモデルの厳密な推定は困難であるが,サンプリングに基づいた手法を導入することで近似的に推定できることを示す.提案モデルを用いることにより,従来手法では良好な性能が得られなかった話者ごとに発話数が大きく異なるデータに対して,頑健なクラスタリングが行えることを示す. 
(英) We proposed a novel speaker clustering method by estimating the structure of a fully Bayesian utterance generative model with a hierarchical structure. We defined the hierarchical generative model as a mixture of GMMs, which represent each speaker's distribution. We approximately estimated this model by introducing a sampling method because strict estimation of this model was infeasible. From speaker clustering experiments, we showed that the proposed method was effective to the data in which the number of utterances varied from speaker to speaker, while the conventional method caused significant degradation in clustering accuracy for these data.
キーワード (和) 話者クラスタリング / フルベイズモデル / サンプリング / 発話単位ディリクレ過程混合モデル / / / /  
(英) Speaker clustering / Fully Bayesian model / Sampling / Utterance-oriented Dirichlet process mixture model / / / /  
文献情報 信学技報, vol. 111, no. 480, IBISML2011-90, pp. 21-28, 2012年3月.
資料番号 IBISML2011-90 
発行日 2012-03-05 (IBISML) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 IBISML  
開催期間 2012-03-12 - 2012-03-13 
開催地(和) 統計数理研究所 
開催地(英) The Institute of Statistical Mathematics 
テーマ(和) 統計数理、データベース、一般 
テーマ(英) Mathematical Statistics, Databases, etc. 
講演論文情報の詳細
申込み研究会 IBISML 
会議コード 2012-03-IBISML 
本文の言語 日本語 
タイトル(和) 階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング 
サブタイトル(和)  
タイトル(英) Fully Bayesian speaker clustering based on hierarchical structured Dirichlet process mixture model 
サブタイトル(英)  
キーワード(1)(和/英) 話者クラスタリング / Speaker clustering  
キーワード(2)(和/英) フルベイズモデル / Fully Bayesian model  
キーワード(3)(和/英) サンプリング / Sampling  
キーワード(4)(和/英) 発話単位ディリクレ過程混合モデル / Utterance-oriented Dirichlet process mixture model  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 俵 直弘 / Naohiro Tawara / タワラ ナオヒロ
第1著者 所属(和/英) 早稲田大学 (略称: 早大)
Wasesda University (略称: Waseda Univ.)
第2著者 氏名(和/英/ヨミ) 小川 哲司 / Tetsuji Ogawa / オガワ テツジ
第2著者 所属(和/英) 早稲田大学 (略称: 早大)
Wasesda University (略称: Waseda Univ.)
第3著者 氏名(和/英/ヨミ) 渡部 晋治 / Shinji Watanabe / ワタナベ シンジ
第3著者 所属(和/英) NTT コミュニケーション科学基礎研究所/ Mitsubishi Electric Research Laboratories (略称: NTT/MERL)
NTT Communication Science Laboratories/Mitsubishi Electric Research Laboratories (略称: NTT/MERL)
第4著者 氏名(和/英/ヨミ) 中村 篤 / Atsushi Nakamura / ナカムラ アツシ
第4著者 所属(和/英) NTT コミュニケーション科学基礎研究所 (略称: NTT)
NTT Communication Science Laboratories (略称: NTT)
第5著者 氏名(和/英/ヨミ) 小林 哲則 / Tetsunori Kobayashi / コバヤシ テツノリ
第5著者 所属(和/英) 早稲田大学 (略称: 早大)
Wasesda University (略称: Waseda Univ.)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2012-03-12 11:25:00 
発表時間 25 
申込先研究会 IBISML 
資料番号 IEICE-IBISML2011-90 
巻番号(vol) IEICE-111 
号番号(no) no.480 
ページ範囲 pp.21-28 
ページ数 IEICE-8 
発行日 IEICE-IBISML-2012-03-05 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会