講演名 2014-10-23
音声の変調スペクトルに現れる個人差の分析(オーガナイズドセッション:ポスター発表,分析,特徴量,音声一般,聴覚一般)
朱 治, 宮内 良太, 鵜木 祐史,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ヒトの声には,その声を発した話者の特徴(個人性)が含まれており,音声を聞くだけで誰が話者であったのかを判別することができる.本研究では,聴覚の知覚メカニズムの側面から音声波形の振幅包絡線に個人性情報が含まれているかどうかを検討する.その第一歩として,本稿では,振幅包絡の変調スペクトルに着目し,聴覚フィルタの帯域幅(ERB_N)で帯域分割された音声の振幅包絡線情報に個人差が現れるかどうかを調査した.その結果,20ERB_N-number以上の周波数帯域で変調スペクトルの分散が大きくなることが分かった.特に,20ERB_N-numberから29ERB_N-numberまでの周波数帯域では,15Hz以下の変調周波数帯域の分散が大きく,30ERB_N-number以上の周波数帯域では,全変調周波数帯域の分散が大きいことが分かった.これらの変調周波数帯域にみられる大きな分散は,音声の振幅包絡線情報に含まれる個人差として強く現れたものと考えられる.
抄録(英) Human voice includes features of own speaker, i.e., speaker individuality. Human, thus, can easily identify speaker by using speaker individuality. This research aims to clarify whether there are physical features related to speaker individualities in the temporal amplitude envelope of speech waveform at the viewpoint of auditory perception. As the first step, in this paper, we investigated whether the individual differences of temporal amplitude envelopes obtained from the output of the auditory filterbank will be observed in, by analyzing variances of modulation spectrum between some speakers. As a result, it was found that the variances of the modulation spectrum over 20 ERB_N-numbers are clearly lager than that of others. In particular, it was found that the largest variances at the modulation frequencies that is lower than 15 Hz are observed in frequency bands ranges from 20 to 29 ERB_N-numbers. In addition, it was also found that the largest variances at whole modulation frequencies are observed in higher frequency bands range than 30 ERB_N-numbers. These results suggested that these larger variances could be interpreted as speaker differences in the temporal amplitude envelopes.
キーワード(和) 音声の個人性 / 振幅包絡線 / 変調スペクトル / 等価矩形帯域幅 / 聴知覚メカニズム
キーワード(英) Speaker individuality / Temporal amplitude envelope / Modulation spectrum / Equivalent rectangular bandwidth / Auditory perception mechanism
資料番号 SP2014-85
発行日

研究会情報
研究会 SP
開催期間 2014/10/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 音声の変調スペクトルに現れる個人差の分析(オーガナイズドセッション:ポスター発表,分析,特徴量,音声一般,聴覚一般)
サブタイトル(和)
タイトル(英) Analysis of Individual Differences on Modulation Spectrum of Speech
サブタイトル(和)
キーワード(1)(和/英) 音声の個人性 / Speaker individuality
キーワード(2)(和/英) 振幅包絡線 / Temporal amplitude envelope
キーワード(3)(和/英) 変調スペクトル / Modulation spectrum
キーワード(4)(和/英) 等価矩形帯域幅 / Equivalent rectangular bandwidth
キーワード(5)(和/英) 聴知覚メカニズム / Auditory perception mechanism
第 1 著者 氏名(和/英) 朱 治 / Zhi ZHU
第 1 著者 所属(和/英) 北陸先端科学技術大学院大学情報科学研究科
School of Information Scienc, Japan Advanced Institute of Science and Technology
第 2 著者 氏名(和/英) 宮内 良太 / Ryota MIYAUCHI
第 2 著者 所属(和/英) 北陸先端科学技術大学院大学情報科学研究科
School of Information Scienc, Japan Advanced Institute of Science and Technology
第 3 著者 氏名(和/英) 鵜木 祐史 / Masashi UNOKI
第 3 著者 所属(和/英) 北陸先端科学技術大学院大学情報科学研究科
School of Information Scienc, Japan Advanced Institute of Science and Technology
発表年月日 2014-10-23
資料番号 SP2014-85
巻番号(vol) vol.114
号番号(no) 272
ページ範囲 pp.-
ページ数 4
発行日