講演名 | 2021-06-19 非同期会話録音に対する時間周波数マスキングと独立ベクトル分析を用いた音源分離の検討 南木 春希(都立大), 山岡 洸瑛(都立大), 若林 佑幸(都立大), 小野 順貴(都立大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本研究では,同期していない複数のボイスレコーダーにより録音された会話音声に対する音源分離の検討を行う.非同期録音に対する前処理として,相互相関と最尤推定によるブラインド同期手法を適用する.次に音源分離手法として,独立ベクトル分析,最大チャネルを選択する時間周波数マスキングや,その出力を局所ガウス分布の分散とした音源モデルによる独立ベクトル分析を検討する.主観評価実験を行い,その結果を示す. |
抄録(英) | In this study, we investigate the source separation for conversational speech recorded by multiple voice recorders that are not synchronized. First, we apply a blind synchronization method based on cross-correlation and maximum likelihood estimation to asynchronous recorded signals. Then, as source separation methods, we investigate independent vector analysis (IVA), a time-frequency (TF) masking-based method to pass only the largest channel, and IVA with a source model in which the variance of the local Gaussian is replaced with a TF masking output mentioned above. An experiment on subjective evaluation is conducted, and the results are shown below. |
キーワード(和) | 時間周波数マスキング / 独立ベクトル分析 / ブラインド音源分離 / 非同期 |
キーワード(英) | Time-frequency masking / Independent vector analysis / Blind source separation / Asynchronous |
資料番号 | SP2021-22 |
発行日 | 2021-06-11 (SP) |
研究会情報 | |
研究会 | SP / IPSJ-SLP / IPSJ-MUS |
---|---|
開催期間 | 2021/6/18(から2日開催) |
開催地(和) | オンライン開催 |
開催地(英) | Online |
テーマ(和) | 音学シンポジウム2021 |
テーマ(英) | OTOGAKU Symposium 2021 |
委員長氏名(和) | 河井 恒(NICT) / 北岡 教英(豊橋技科大) / 竹川 佳成(はこだて未来大) |
委員長氏名(英) | Hisashi Kawai(NICT) / 北岡 教英(豊橋技科大) / 竹川 佳成(はこだて未来大) |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | 高道 慎之介(東大) / 小川 哲司(早大) / 秋田 祐哉(京大) / 太刀岡 勇気(デンソー) / 高島 遼一(神戸大) / 高道 慎之介(東大) / 森勢 将雅(明治大) / 松原 正樹(筑波大) / 糸山 克寿(東工大) / 深山 覚(産総研) / 大石 康智(NTT) / 平田 圭二(はこだて未来大) |
幹事氏名(英) | Shinnosuke Takamichi(Univ. of Tokyo) / Tetsuji Ogawa(Waseda Univ.) / 秋田 祐哉(京大) / 太刀岡 勇気(デンソー) / 高島 遼一(神戸大) / 高道 慎之介(東大) / 森勢 将雅(明治大) / 松原 正樹(筑波大) / 糸山 克寿(東工大) / 深山 覚(産総研) / 大石 康智(NTT) / 平田 圭二(はこだて未来大) |
幹事補佐氏名(和) | 井島 勇祐(NTT) |
幹事補佐氏名(英) | Yusuke Ijima(NTT) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Speech / Special Interest Group on Spoken Language Processing / Special Interest Group on Music and Computer |
---|---|
本文の言語 | JPN |
タイトル(和) | 非同期会話録音に対する時間周波数マスキングと独立ベクトル分析を用いた音源分離の検討 |
サブタイトル(和) | |
タイトル(英) | Source Separation for Asynchronous Recordings of Conversation Using Time-Frequency Masking and Independent Vector Analysis |
サブタイトル(和) | |
キーワード(1)(和/英) | 時間周波数マスキング / Time-frequency masking |
キーワード(2)(和/英) | 独立ベクトル分析 / Independent vector analysis |
キーワード(3)(和/英) | ブラインド音源分離 / Blind source separation |
キーワード(4)(和/英) | 非同期 / Asynchronous |
第 1 著者 氏名(和/英) | 南木 春希 / Haruki Nammoku |
第 1 著者 所属(和/英) | 東京都立大学(略称:都立大) Tokyo Metropolitan University(略称:TMU) |
第 2 著者 氏名(和/英) | 山岡 洸瑛 / Kouei Yamaoka |
第 2 著者 所属(和/英) | 東京都立大学(略称:都立大) Tokyo Metropolitan University(略称:TMU) |
第 3 著者 氏名(和/英) | 若林 佑幸 / Yukoh Wakabayashi |
第 3 著者 所属(和/英) | 東京都立大学(略称:都立大) Tokyo Metropolitan University(略称:TMU) |
第 4 著者 氏名(和/英) | 小野 順貴 / Nobutaka Ono |
第 4 著者 所属(和/英) | 東京都立大学(略称:都立大) Tokyo Metropolitan University(略称:TMU) |
発表年月日 | 2021-06-19 |
資料番号 | SP2021-22 |
巻番号(vol) | vol.121 |
号番号(no) | SP-66 |
ページ範囲 | pp.101-106(SP), |
ページ数 | 6 |
発行日 | 2021-06-11 (SP) |