電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2010-05-26 13:25
会議音声認識のためのスペクトル減算に基づくオンライン音源分離
那須 悠篠田浩一古井貞熙東工大
抄録 (和) 会議音声の認識を目的とした実時間処理が可能な音源分離手法を提案する.提案法では,スペクトル減算法に基づき,各話者が装着するピンマイクによる観測信号から目的話者の音声以外の信号成分を減算することにより音声の分離を行う.従来手法と比較して必要な演算量が小さく,また分離信号の歪みが小さく音声認識に適する.計算機シミュレーションによる音声認識実験では,同時発話を含む音声の単語正解精度が 66.5 % であったものが,提案法の適用により 77.7 % に改善された.実環境で収録した会議音声に対しても音声区間検出と音声認識の評価を行い,精度の向上を確認した. 
(英) This paper proposes a speech separation method for meeting speech recognition, which operates in real time. The proposed method suppresses interfering components in speech signals using spectral subtraction, where the signals are recorded with tie-clip microphones attached to the lapels of the speakers. Compared with the other conventional methods, it requires less computational costs and the separated speech signals have less distortion. In a recognition task of simulated partly-overlapped speech, the proposed method improved the word accuracy from 66.5 % to 77.7 %. We also evaluated the method on speech data recorded in real meeting, and con firmed the improvement in accuracies of voice activity detection and speech recognition.
キーワード (和) 音源分離 / スペクトル減算 / 音声区間検出 / 会議音声認識 / / / /  
(英) Sound source separation / Spectral subtraction / Voice activity detection / Meeting speech recognition / / / /  
文献情報 信学技報, vol. 110, no. 56, SP2010-2, pp. 7-12, 2010年5月.
資料番号 SP2010-2 
発行日 2010-05-19 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 SP EA SIP  
開催期間 2010-05-26 - 2010-05-27 
開催地(和) 甲南大学平生セミナーハウス 
開催地(英) Konan Univ. (Hirao Seminar House) 
テーマ(和) 音声,応用/電気音響,信号処理,および一般 
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing,and Related Topics 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2010-05-SP-EA-SIP 
本文の言語 日本語 
タイトル(和) 会議音声認識のためのスペクトル減算に基づくオンライン音源分離 
サブタイトル(和)  
タイトル(英) Online Speech Separation based on Spectral Subtraction for Meeting Speech Recognition 
サブタイトル(英)  
キーワード(1)(和/英) 音源分離 / Sound source separation  
キーワード(2)(和/英) スペクトル減算 / Spectral subtraction  
キーワード(3)(和/英) 音声区間検出 / Voice activity detection  
キーワード(4)(和/英) 会議音声認識 / Meeting speech recognition  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 那須 悠 / Yu Nasu / ナス ユウ
第1著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Inst. of Tech.)
第2著者 氏名(和/英/ヨミ) 篠田 浩一 / Koichi Shinoda / シノダ コウイチ
第2著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Inst. of Tech.)
第3著者 氏名(和/英/ヨミ) 古井 貞熙 / Sadaoki Furui / フルイ サダオキ
第3著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Inst. of Tech.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2010-05-26 13:25:00 
発表時間 25 
申込先研究会 SP 
資料番号 IEICE-EA2010-2,IEICE-SIP2010-2,IEICE-SP2010-2 
巻番号(vol) IEICE-110 
号番号(no) no.54(EA), no.55(SIP), no.56(SP) 
ページ範囲 pp.7-12 
ページ数 IEICE-6 
発行日 IEICE-EA-2010-05-19,IEICE-SIP-2010-05-19,IEICE-SP-2010-05-19 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会