講演名 2014-02-28
線形予測残差の尖度に基づく近端/遠端話者判別の提案(一般,時系列パターン認識,一般)
林田 亘平, 中山 雅人, 西浦 敬信, 山下 洋一, 堀内 俊治, 加藤 恒夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) マイクロホンで受音した信号から所望の音声のみを判別することは,有用な音声インタフェースやテレビ会議システムを実現する上で重要になる.従来の発話区間検出(VAD)では,複数のマイクロホンで受音した信号から推定した音源の方向を基に所望音声と不要音声との判別を行っている.そのため,話者の方向を推定するために複数のマイクロホンが必要となる.そこで本研究では,単一のマイクロホンのみを用いて所望音声と不要音声とを判別する方法について検討した.本研究では,所望の話者はマイクロホンから一定の距離より近くに存在すると仮定する.提案法では単一のマイクロホンで受音した音声の線形予測残差の尖度に基づいて,受音した音声が近端話者によって発話されたのかどうかを判別することで,所望音声と不要音声とを判別する.実環境における評価実験の結果から,提案法は一般的な残響環境において判別の境界を1000mmとした場合に,10%以下の等誤り率で近端話者と遠端話者とを判別可能であることを確認した.また,提案法は実時間で処理が可能であることを確認した.
抄録(英) Desired/undesired speech discrimination is as important as speech/non-speech discrimination to achieve useful applications such as speech interfaces and teleconferencing systems. Conventional methods of voice activity detection utilize the directional information of sound sources to distinguish desired from undesired speech and have to utilize multiple microphones. Here, we assumed that the desired talkers would be close to the microphone, and we proposed a new method to discriminate close-talking speech from distant-talking speech with a single microphone based on the kurtosis of the linear prediction residual signals. The experimental results revealed that the proposed method could distinguish close-talking speech from distant-talking speech within a 10% equal error rate in ordinary reverberant environments with real-time processing.
キーワード(和) 近端/遠端話者判別 / 線形予測残差 / 尖度
キーワード(英) Close/distant talker discrimination / linear prediction residual signal / kurtosis
資料番号 SP2013-107
発行日

研究会情報
研究会 SP
開催期間 2014/2/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 線形予測残差の尖度に基づく近端/遠端話者判別の提案(一般,時系列パターン認識,一般)
サブタイトル(和)
タイトル(英) A proposal of close/distant talker discrimination based on kurtosis of linear prediction residual signals
サブタイトル(和)
キーワード(1)(和/英) 近端/遠端話者判別 / Close/distant talker discrimination
キーワード(2)(和/英) 線形予測残差 / linear prediction residual signal
キーワード(3)(和/英) 尖度 / kurtosis
第 1 著者 氏名(和/英) 林田 亘平 / Kohei HAYASHIDA
第 1 著者 所属(和/英) 立命館大学大学院情報理工学研究科
Graduate School of Information Scinence and Engineering, Ritsumeikan University
第 2 著者 氏名(和/英) 中山 雅人 / Masato NAKAYAMA
第 2 著者 所属(和/英) 立命館大学情報理工学部
Colleage of Information Science and Engineering, Ritsumeikan University
第 3 著者 氏名(和/英) 西浦 敬信 / Takanobu NISHIURA
第 3 著者 所属(和/英) 立命館大学情報理工学部
Colleage of Information Science and Engineering, Ritsumeikan University
第 4 著者 氏名(和/英) 山下 洋一 / Yoichi YAMASHITA
第 4 著者 所属(和/英) 立命館大学情報理工学部
Colleage of Information Science and Engineering, Ritsumeikan University
第 5 著者 氏名(和/英) 堀内 俊治 / Toshiharu HORIUCHI
第 5 著者 所属(和/英) 株式会社KDDI研究所ユーザインタフェースグループ
User Interface Laboratory, KDDI R&D Laboratories, Inc.
第 6 著者 氏名(和/英) 加藤 恒夫 / Tsuneo KATO
第 6 著者 所属(和/英) 株式会社KDDI研究所ユーザインタフェースグループ
User Interface Laboratory, KDDI R&D Laboratories, Inc.
発表年月日 2014-02-28
資料番号 SP2013-107
巻番号(vol) vol.113
号番号(no) 452
ページ範囲 pp.-
ページ数 6
発行日