講演抄録/キーワード |
講演名 |
2011-05-12 15:00
[招待講演]複数人会話シーン分析におけるマイクロホンアレイ音声処理 ○荒木章子・藤本雅清・吉岡拓也・堀 貴明・中谷智広(NTT) EA2011-15 SIP2011-15 SP2011-15 |
抄録 |
(和) |
近年,会話音声の自動アノテーションや議事録作成,会議支援などを目的に,会話音声を認識・理解する会話シーン分析の研究が国内外で盛んに行なわれている.会話においては,複数話者が自由に発話することから,収録音声は複数話者の声や環境雑音が重畳された複雑な構造をしており,音声認識などの分析を行なう際には,様々な音声処理技術が必要である.本稿では,会話シーン分析で用いられる,マイクロホンアレイによる音声強調処理と話者区間推定(ダイアライゼーション)にフォーカスを当て,その代表的な技術を紹介する. |
(英) |
Recognition and understanding of conversation scenes has recently been tackled to achieve a variety of tasks such as automatic annotation, minute taking, and meeting assistance. Since participants speak spontaneously in a conversation, a recorded conversation includes many speaker overlaps and ambient noise. To handle such complicated recordings, speech signal processing techniques play an important role. This paper outlines some
multi-channel speech enhancement and "who spoke when" estimation (speaker diarization) techniques for conversation scene analysis. |
キーワード |
(和) |
会話シーン分析 / 遠隔発話 / 音声強調 / ビームフォーミング / ダイアライゼーション / / / |
(英) |
Conversation scene analysis / distant talking / speech enhancement / beamforming / speaker diarization / / / |
文献情報 |
信学技報, vol. 111, no. 26, EA2011-15, pp. 83-88, 2011年5月. |
資料番号 |
EA2011-15 |
発行日 |
2011-05-05 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2011-15 SIP2011-15 SP2011-15 |
研究会情報 |
研究会 |
EA SIP SP |
開催期間 |
2011-05-12 - 2011-05-13 |
開催地(和) |
立命館大学 |
開催地(英) |
Ritsumeikan Univ. |
テーマ(和) |
音声・音響信号処理,音声及び一般 |
テーマ(英) |
Speech and Acoustic Signal Processing, Speech, and Related Topics |
講演論文情報の詳細 |
申込み研究会 |
EA |
会議コード |
2011-05-EA-SIP-SP |
本文の言語 |
日本語 |
タイトル(和) |
複数人会話シーン分析におけるマイクロホンアレイ音声処理 |
サブタイトル(和) |
|
タイトル(英) |
Microphone array speech processing techniques for conversation scene analysis |
サブタイトル(英) |
|
キーワード(1)(和/英) |
会話シーン分析 / Conversation scene analysis |
キーワード(2)(和/英) |
遠隔発話 / distant talking |
キーワード(3)(和/英) |
音声強調 / speech enhancement |
キーワード(4)(和/英) |
ビームフォーミング / beamforming |
キーワード(5)(和/英) |
ダイアライゼーション / speaker diarization |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
荒木 章子 / Shoko Araki / アラキ ショウコ |
第1著者 所属(和/英) |
NTT (略称: NTT)
NTT (略称: NTT) |
第2著者 氏名(和/英/ヨミ) |
藤本 雅清 / Masakiyo Fujimoto / フジモト マサキヨ |
第2著者 所属(和/英) |
NTT (略称: NTT)
NTT (略称: NTT) |
第3著者 氏名(和/英/ヨミ) |
吉岡 拓也 / Takuya Yoshioka / ヨシオカ タクヤ |
第3著者 所属(和/英) |
NTT (略称: NTT)
NTT (略称: NTT) |
第4著者 氏名(和/英/ヨミ) |
堀 貴明 / Takaaki Hori / ホリ タカアキ |
第4著者 所属(和/英) |
NTT (略称: NTT)
NTT (略称: NTT) |
第5著者 氏名(和/英/ヨミ) |
中谷 智広 / Tomohiro Nakatani / ナカタニ トモヒロ |
第5著者 所属(和/英) |
NTT (略称: NTT)
NTT (略称: NTT) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2011-05-12 15:00:00 |
発表時間 |
60分 |
申込先研究会 |
EA |
資料番号 |
EA2011-15, SIP2011-15, SP2011-15 |
巻番号(vol) |
vol.111 |
号番号(no) |
no.26(EA), no.27(SIP), no.28(SP) |
ページ範囲 |
pp.83-88 |
ページ数 |
6 |
発行日 |
2011-05-05 (EA, SIP, SP) |
|