非同期会話録音に対する時間周波数マスキングと独立ベクトル分析を用いた音源分離の検討

南木 春希; 山岡 洸瑛; 若林 佑幸; 小野 順貴

講演名	2021-06-19 非同期会話録音に対する時間周波数マスキングと独立ベクトル分析を用いた音源分離の検討南木春希(都立大), 山岡洸瑛(都立大), 若林佑幸(都立大), 小野順貴(都立大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本研究では，同期していない複数のボイスレコーダーにより録音された会話音声に対する音源分離の検討を行う．非同期録音に対する前処理として，相互相関と最尤推定によるブラインド同期手法を適用する．次に音源分離手法として，独立ベクトル分析，最大チャネルを選択する時間周波数マスキングや，その出力を局所ガウス分布の分散とした音源モデルによる独立ベクトル分析を検討する．主観評価実験を行い，その結果を示す．
抄録(英)	In this study, we investigate the source separation for conversational speech recorded by multiple voice recorders that are not synchronized. First, we apply a blind synchronization method based on cross-correlation and maximum likelihood estimation to asynchronous recorded signals. Then, as source separation methods, we investigate independent vector analysis (IVA), a time-frequency (TF) masking-based method to pass only the largest channel, and IVA with a source model in which the variance of the local Gaussian is replaced with a TF masking output mentioned above. An experiment on subjective evaluation is conducted, and the results are shown below.
キーワード(和)	時間周波数マスキング / 独立ベクトル分析 / ブラインド音源分離 / 非同期
キーワード(英)	Time-frequency masking / Independent vector analysis / Blind source separation / Asynchronous
資料番号	SP2021-22
発行日	2021-06-11 (SP)

研究会情報
研究会	SP / IPSJ-SLP / IPSJ-MUS
開催期間	2021/6/18(から2日開催)
開催地（和）	オンライン開催
開催地（英）	Online
テーマ（和）	音学シンポジウム2021
テーマ（英）	OTOGAKU Symposium 2021
委員長氏名（和）	河井恒(NICT) / 北岡教英(豊橋技科大) / 竹川佳成(はこだて未来大)
委員長氏名（英）	Hisashi Kawai(NICT) / 北岡教英(豊橋技科大) / 竹川佳成(はこだて未来大)
副委員長氏名（和）
副委員長氏名（英）
幹事氏名（和）	高道慎之介(東大) / 小川哲司(早大) / 秋田祐哉(京大) / 太刀岡勇気(デンソー) / 高島遼一(神戸大) / 高道慎之介(東大) / 森勢将雅(明治大) / 松原正樹(筑波大) / 糸山克寿(東工大) / 深山覚(産総研) / 大石康智(NTT) / 平田圭二(はこだて未来大)
幹事氏名（英）	Shinnosuke Takamichi(Univ. of Tokyo) / Tetsuji Ogawa(Waseda Univ.) / 秋田祐哉(京大) / 太刀岡勇気(デンソー) / 高島遼一(神戸大) / 高道慎之介(東大) / 森勢将雅(明治大) / 松原正樹(筑波大) / 糸山克寿(東工大) / 深山覚(産総研) / 大石康智(NTT) / 平田圭二(はこだて未来大)
幹事補佐氏名（和）	井島勇祐(NTT)
幹事補佐氏名（英）	Yusuke Ijima(NTT)

講演論文情報詳細
申込み研究会	Technical Committee on Speech / Special Interest Group on Spoken Language Processing / Special Interest Group on Music and Computer
本文の言語	JPN
タイトル（和）	非同期会話録音に対する時間周波数マスキングと独立ベクトル分析を用いた音源分離の検討
サブタイトル（和）
タイトル（英）	Source Separation for Asynchronous Recordings of Conversation Using Time-Frequency Masking and Independent Vector Analysis
サブタイトル（和）
キーワード(1)（和/英）	時間周波数マスキング / Time-frequency masking
キーワード(2)（和/英）	独立ベクトル分析 / Independent vector analysis
キーワード(3)（和/英）	ブラインド音源分離 / Blind source separation
キーワード(4)（和/英）	非同期 / Asynchronous
第 1 著者氏名（和/英）	南木春希 / Haruki Nammoku
第 1 著者所属（和/英）	東京都立大学(略称：都立大) Tokyo Metropolitan University(略称：TMU)
第 2 著者氏名（和/英）	山岡洸瑛 / Kouei Yamaoka
第 2 著者所属（和/英）	東京都立大学(略称：都立大) Tokyo Metropolitan University(略称：TMU)
第 3 著者氏名（和/英）	若林佑幸 / Yukoh Wakabayashi
第 3 著者所属（和/英）	東京都立大学(略称：都立大) Tokyo Metropolitan University(略称：TMU)
第 4 著者氏名（和/英）	小野順貴 / Nobutaka Ono
第 4 著者所属（和/英）	東京都立大学(略称：都立大) Tokyo Metropolitan University(略称：TMU)
発表年月日	2021-06-19
資料番号	SP2021-22
巻番号（vol）	vol.121
号番号（no）	SP-66
ページ範囲	pp.101-106(SP),
ページ数	6
発行日	2021-06-11 (SP)