電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2016-03-29 10:45
テンソル分解に基づく音声表現とその言語識別・話者識別への応用
鈴木 颯齋藤大輔峯松信明東大
技報オンラインサービス実施中
抄録 (和) 本稿では、言語識別・話者識別を想定した音声の特徴量表現の新しい手法として、テンソル分解に基づく音声表現を提案する。近年、言語識別・話者識別分野では i-vector が標準的な特徴量表現の手法となっているが、i-vector では各発話の GMM を構成する各ガウス分布の平均ベクトルを連結して得られる GMM supervector (GMM-SV) を基に特徴量空間が構築される。本稿では、GMM-SV 表現に内在する問題に着目し、特徴量空間構築のための学習データセットをテンソルとして表現し、これに対しテンソル解析を導入することで言語・話者を表現することを検討する。提案手法では特徴量空間構築の際に、各発話を GMM-SV ではなく行および列がそれぞれ GMM の各分布と平均ベクトルに対応するような行列によって表現し、GMM の各分布の関係性を明示的に捉える。本稿では提案手法を言語識別・話者識別に適用し、その有効性を実験的に示す。 
(英) This paper proposes a novel approach to speech representation for automatic identification of languages and speakers by characterizing the entire feature space by a tensor. In conventional studies of both tasks, i-vector is commonly used as the state-of-the-art representation. Here, i-vector is derived by modeling each utterance
as a GMM and projecting its supervector (GMM-SV) onto a low-dimensional space. In this paper, for the aim of explicit modeling of the correlation among mean vectors of a GMM, an utterance is not modeled as its GMM-based supervector but as its matrix and the entire set of utterances is modeled as its tensor. By projecting the tensor to a lower dimensional space, we obtain a new representation for an input utterance. We apply this method to two tasks of automatic identification of languages and speakers and evaluate its effectiveness.
キーワード (和) 言語識別 / 話者識別 / 混合正規分布モデル / GMM スーパーベクトル / i-vector / テンソル解析 / Tucker 分解 /  
(英) language identification / speaker identification / Gaussian mixture model / GMM supervector / i-vector / tensor analysis / Tucker decomposition /  
文献情報 信学技報, vol. 115, no. 523, SP2015-155, pp. 341-346, 2016年3月.
資料番号 SP2015-155 
発行日 2016-03-21 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 EA SP SIP  
開催期間 2016-03-28 - 2016-03-29 
開催地(和) 別府国際コンベンションセンター B-ConPlaza 
開催地(英) Beppu International Convention Center B-ConPlaza 
テーマ(和) 応用/電気音響,音声,信号処理,一般 
テーマ(英) Engineering/Electro Acoustics, Speech, Signal Processing, and Related Topics 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2016-03-EA-SIP-SP 
本文の言語 日本語 
タイトル(和) テンソル分解に基づく音声表現とその言語識別・話者識別への応用 
サブタイトル(和)  
タイトル(英) Tensor-based Speech Representation and its Application to Identification of Languages and Speakers 
サブタイトル(英)  
キーワード(1)(和/英) 言語識別 / language identification  
キーワード(2)(和/英) 話者識別 / speaker identification  
キーワード(3)(和/英) 混合正規分布モデル / Gaussian mixture model  
キーワード(4)(和/英) GMM スーパーベクトル / GMM supervector  
キーワード(5)(和/英) i-vector / i-vector  
キーワード(6)(和/英) テンソル解析 / tensor analysis  
キーワード(7)(和/英) Tucker 分解 / Tucker decomposition  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 鈴木 颯 / So Suzuki / スズキ ソウ
第1著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo)
第2著者 氏名(和/英/ヨミ) 齋藤 大輔 / Daisuke Saito / サイトウ ダイスケ
第2著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo)
第3著者 氏名(和/英/ヨミ) 峯松 信明 / Nobuaki Minematsu / ミネマツ ノブアキ
第3著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: UTokyo)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2016-03-29 10:45:00 
発表時間 25 
申込先研究会 SP 
資料番号 IEICE-EA2015-127,IEICE-SIP2015-176,IEICE-SP2015-155 
巻番号(vol) IEICE-115 
号番号(no) no.521(EA), no.522(SIP), no.523(SP) 
ページ範囲 pp.341-346 
ページ数 IEICE-6 
発行日 IEICE-EA-2016-03-21,IEICE-SIP-2016-03-21,IEICE-SP-2016-03-21 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会