講演名 2007/12/13
ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
石塚 健太郎, 荒木 章子, 藤本 雅清, 瀬戸口 久雄, 高梨 克也, 河原 達也,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 会議やポスター発表などの,多人数によるインタラクションを含む場面において,「誰がいつ話したか?」を検出できれば,検索のためにインデクスを付与する場合や談話構造分析の手がかりとして有用である.この実現のためには,まず観測信号の中から何らかの音声が話されている区間を取り出し(発話区間検出),検出された音声区間について発話者を分類する必要がある(話者識別).本稿では,マイクロホンアレイによりポスター発表を収録して得られた音声データに対し,「いつ」を捉えるために音声の周期性・非周期性の比を用いた発話区間検出技術を適用し,「誰が」を捉えるために音声信号の到来方向を用いた話者識別の手法を適用した場合について,その結果得られる話者識別性能に関し予備的な検討を行った.
抄録(英) Detecting "Who spoke when?" from multi-party interactions such as meetings and poster presentations is valuable for adding metadata to the recordings or analyzing the discourse-structures of the multi-party interactions. To realize this function, we first detect speech periods from the observed signals (speech activity detection), and then classify the speech periods by its speakers (speaker diarization). In this paper, we adopt a speech activity detection method and a speaker diarization method to the recordings of poster sessions. The speech activity method performs based on the ratios of periodic and aperiodic components of observed signals. The speaker diarization method utilizes the direction of arrival estimation of the detected speech signals obtained from a microphone array. This paper reports preliminary results obtained from these methods.
キーワード(和) 話者識別 / 発話区間検出 / マイクロホンアレイ / 多人数インタラクション
キーワード(英) Speaker diarization / Speech activity detection / Microphone array / Multi-party interaction
資料番号 NLC2007-70,SP2007-133
発行日

研究会情報
研究会 SP
開催期間 2007/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) A Study on Speech Activity Detection and Speaker Diarization for the Recordings of Poster Sessions
サブタイトル(和)
キーワード(1)(和/英) 話者識別 / Speaker diarization
キーワード(2)(和/英) 発話区間検出 / Speech activity detection
キーワード(3)(和/英) マイクロホンアレイ / Microphone array
キーワード(4)(和/英) 多人数インタラクション / Multi-party interaction
第 1 著者 氏名(和/英) 石塚 健太郎 / Kentaro ISHIZUKA
第 1 著者 所属(和/英) 日本電信電話株式会社NTTコミュニケーション科学基礎研究所:京都大学大学院情報学研究科
NTT Communication Science Laboratories, NTT Corp.:Graduate School of Informatics, Kyoto University
第 2 著者 氏名(和/英) 荒木 章子 / Shoko ARAKI
第 2 著者 所属(和/英) 日本電信電話株式会社NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corp.
第 3 著者 氏名(和/英) 藤本 雅清 / Masakiyo FUJIMOTO
第 3 著者 所属(和/英) 日本電信電話株式会社NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corp.
第 4 著者 氏名(和/英) 瀬戸口 久雄 / Hisao SETOGUCHI
第 4 著者 所属(和/英) 京都大学大学院情報学研究科
Graduate School of Informatics, Kyoto University
第 5 著者 氏名(和/英) 高梨 克也 / Katsuya TAKANASHI
第 5 著者 所属(和/英) 京都大学学術情報メディアセンター
Academic Center for Computing and Media Studies, Kyoto University
第 6 著者 氏名(和/英) 河原 達也 / Tatsuya KAWAHARA
第 6 著者 所属(和/英) 京都大学大学院情報学研究科:京都大学学術情報メディアセンター
Graduate School of Informatics, Kyoto University:Academic Center for Computing and Media Studies, Kyoto University
発表年月日 2007/12/13
資料番号 NLC2007-70,SP2007-133
巻番号(vol) vol.107
号番号(no) 406
ページ範囲 pp.-
ページ数 6
発行日