電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2010-05-27 09:00
擬音語HMMに基づく音場ディクテーションの検討
林田亘平溝口 遊森勢将雅西浦敬信立命館大
抄録 (和) これまで環境音は雑音として扱われ,音声認識の前処理などにおいて除去すべき対象として研究が行われてきた.しかし近年,環境音を含めた音環境の理解に注目が集まっている.音環境の理解によって,音場ディクテーションなどが可能となる.
従来の環境音識別では,音源そのものを全て個々にモデル化する方法が提案されている.しかし,実世界に無数に存在する環境音を全てモデル化することは不可能である.そこで本研究では,擬音語モデルによる環境音識別を検討する. 擬音語は文字表記から音源を想起可能である.この特性を利用し,無数に存在する環境音から類似した音源を1つのモデルで表現することで,有限個の擬音語モデルによる環境音識別が可能となる.本研究ではまず予備実験を行い,環境音識別のための最適パラメータが,標本化周波数16kHz,MFCC16次元,8状態,128混合であることを確認し,また環境音と擬音語の対応関係について調査した.そして,音源ごとにモデル化を行う従来法と,擬音語モデルを用いる提案法について環境音識別実験を実施し,従来法と比較して提案法の誤識別率が低下することを確認した.最後に主観評価実験の結果,従来法と比較し提案法は,識別結果から音源を容易に想起可能であることを確認した. 
(英) In this study, we focus on the environmental sound identification for realizing acoustic sound dictation. The conventional research for the environmental sound identification was only conducted with the method which individually models all sound sources. However, it is impossible to model the innumerably environmental sounds in the real world. In this study, we proposed Hidden Markov Model (HMM) based on the onomatopoeia, and try to reduce number of the models. As a result of evaluation experiment, the proposed approach accurately realized the acoustic sound field dictation with easy-understanding for human being.
キーワード (和) 環境音 / HMM / 擬音語 / 音場ディクテーション / 音場理解 / / /  
(英) Environmental sound / HMM / Onomatopoeia / Sound field dictation / Sound field understanding / / /  
文献情報 信学技報, vol. 110, no. 56, SP2010-10, pp. 55-60, 2010年5月.
資料番号 SP2010-10 
発行日 2010-05-19 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 SP EA SIP  
開催期間 2010-05-26 - 2010-05-27 
開催地(和) 甲南大学平生セミナーハウス 
開催地(英) Konan Univ. (Hirao Seminar House) 
テーマ(和) 音声,応用/電気音響,信号処理,および一般 
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing,and Related Topics 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2010-05-SP-EA-SIP 
本文の言語 日本語 
タイトル(和) 擬音語HMMに基づく音場ディクテーションの検討 
サブタイトル(和)  
タイトル(英) A Study of the Acoustic Sound Field Dictation with Hidden Markov Model Based on an Onomatopoeia 
サブタイトル(英)  
キーワード(1)(和/英) 環境音 / Environmental sound  
キーワード(2)(和/英) HMM / HMM  
キーワード(3)(和/英) 擬音語 / Onomatopoeia  
キーワード(4)(和/英) 音場ディクテーション / Sound field dictation  
キーワード(5)(和/英) 音場理解 / Sound field understanding  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 林田 亘平 / Kohei Hayashida / ハヤシダ コウヘイ
第1著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第2著者 氏名(和/英/ヨミ) 溝口 遊 / Yu Mizoguchi / ミゾグチ ユウ
第2著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第3著者 氏名(和/英/ヨミ) 森勢 将雅 / Masanori Morise / モリセ マサノリ
第3著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第4著者 氏名(和/英/ヨミ) 西浦 敬信 / Takanobu Nishiura / ニシウラ タカノブ
第4著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2010-05-27 09:00:00 
発表時間 25 
申込先研究会 SP 
資料番号 IEICE-EA2010-10,IEICE-SIP2010-10,IEICE-SP2010-10 
巻番号(vol) IEICE-110 
号番号(no) no.54(EA), no.55(SIP), no.56(SP) 
ページ範囲 pp.55-60 
ページ数 IEICE-6 
発行日 IEICE-EA-2010-05-19,IEICE-SIP-2010-05-19,IEICE-SP-2010-05-19 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会