講演名 2010-05-27
擬音語HMMに基づく音場ディクテーションの検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
林田 亘平, 溝口 遊, 森勢 将雅, 西浦 敬信,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) これまで環境音は雑音として扱われ,音声認識の前処理などにおいて除去すべき対象として研究が行われてきた.しかし近年,環境音を含めた音環境の理解に注目が集まっている.音環境の理解によって,音場ディクテーションなどが可能となる.従来の環境音識別では,音源そのものを全て個々にモデル化する方法が提案されている.しかし,実世界に無数に存在する環境音を全てモデル化することは不可能である.そこで本研究では,擬音語モデルによる環境音識別を検討する.擬音語は文字表記から音源を想起可能である.この特性を利用し,無数に存在する環境音から類似した音源を1つのモデルで表現することで,有限個の擬音語モデルによる環境音識別が可能となる.本研究ではまず予備実験を行い,環境音識別のための最適パラメータが,標本化周波数16kHz,MFCC16次元,8状態,128混合であることを確認し,また環境音と擬音語の対応関係について調査した.そして,音源ごとにモデル化を行う従来法と,擬音語モデルを用いる提案法について環境音識別実験を実施し,従来法と比較して提案法の誤識別率が低下することを確認した.最後に主観評価実験の結果,従来法と比較し提案法は,識別結果から音源を容易に想起可能であることを確認した.
抄録(英) In this study, we focus on the environmental sound identification for realizing acoustic sound dictation. The conventional research for the environmental sound identification was only conducted with the method which individually models all sound sources. However, it is impossible to model the innumerably environmental sounds in the real world. In this study, we proposed Hidden Markov Model (HMM) based on the onomatopoeia, and try to reduce number of the models. As a result of evaluation experiment, the proposed approach accurately realized the acoustic sound field dictation with easy-understanding for human being.
キーワード(和) 環境音 / HMM / 擬音語 / 音場ディクテーション / 音場理解
キーワード(英) Environmental sound / HMM / Onomatopoeia / Sound field dictation / Sound field understanding
資料番号 EA2010-10,SIP2010-10,SP2010-10
発行日

研究会情報
研究会 SIP
開催期間 2010/5/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Signal Processing (SIP)
本文の言語 JPN
タイトル(和) 擬音語HMMに基づく音場ディクテーションの検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)
サブタイトル(和)
タイトル(英) A Study of the Acoustic Sound Field Dictation with Hidden Markov Model Based on an Onomatopoeia
サブタイトル(和)
キーワード(1)(和/英) 環境音 / Environmental sound
キーワード(2)(和/英) HMM / HMM
キーワード(3)(和/英) 擬音語 / Onomatopoeia
キーワード(4)(和/英) 音場ディクテーション / Sound field dictation
キーワード(5)(和/英) 音場理解 / Sound field understanding
第 1 著者 氏名(和/英) 林田 亘平 / Kohei HAYASHIDA
第 1 著者 所属(和/英) 立命館大学大学院理工学研究科
Graduate School of Scinence and Engineering, Ritsumeikan University
第 2 著者 氏名(和/英) 溝口 遊 / Yu MIZOGUCHI
第 2 著者 所属(和/英) 立命館大学大学院理工学研究科
Graduate School of Scinence and Engineering, Ritsumeikan University
第 3 著者 氏名(和/英) 森勢 将雅 / Masanori MORISE
第 3 著者 所属(和/英) 立命館大学情報理工学部
College of Information and Science, Ritsumeikan University
第 4 著者 氏名(和/英) 西浦 敬信 / Takanobu NISHIURA
第 4 著者 所属(和/英) 立命館大学情報理工学部
College of Information and Science, Ritsumeikan University
発表年月日 2010-05-27
資料番号 EA2010-10,SIP2010-10,SP2010-10
巻番号(vol) vol.110
号番号(no) 55
ページ範囲 pp.-
ページ数 6
発行日