講演抄録/キーワード |
講演名 |
2015-03-03 10:45
[ポスター講演]DNNの出力確率から構築したサブワード間及び状態間音響距離によるSTDの精度向上 ○紺野良太(岩手県立大)・李 時旭(産総研)・田中和世(筑波大)・小嶋和徳・伊藤慶明(岩手県立大) EA2014-109 SIP2014-150 SP2014-172 |
抄録 |
(和) |
近年,音声データや動画データから特定のシーンを検索するために,音声中の検索語検出(STD: Spoken-Term Detection)の研究が盛んに行われている.STDでは高速化のため,検索対象の音声ドキュメントを予めサブワード認識しておき,システムに検索語が与えられると,検索語のサブワード系列と音声ドキュメントのサブワード系列を照合し,検索結果を出力する.照合の際のサブワード間の距離には,edit distanceやサブワード間音響距離などが使用される.本稿では,検索精度の向上を目的として,HMMを構成する各状態において,DNNより出力される確率分布を用いてサブワード間及び状態間の音響距離を定義する方式を提案する.これまで我々が用いてきたサブワードHMMの統計量に基づくサブワード間音響距離と提案方式による新たな音響距離との比較実験を,NTCIR-9,10で用いられた4つのテストセットを用いて行った.GMM-HMMによる音声ドキュメントのサブワード認識結果を用いた場合,提案方式により,サブワード間照合で平均+1.27pt,状態間照合で平均+0.24pt,DNN-HMMによる音声ドキュメントのサブワード認識結果を用いた場合,サブワード間照合で平均+4.01pt,状態間照合で平均+2.84pt検索精度が向上し,提案方式の有効性を検証できた. |
(英) |
This paper proposes acoustic distance between subwords and states obtained from DNN for Spoken-Term Detection (STD). The experimental results demonstrated the proposed method worked well for open test collections that were distributed from National Institute of Informatics (NII) for STD evaluation. |
キーワード |
(和) |
音声中の検索語検出 / STD / DNN / 音響距離 / / / / |
(英) |
Spoken-Term Detection / STD / DNN / Acoustic Distance / / / / |
文献情報 |
信学技報, vol. 114, no. 475, SP2014-172, pp. 201-206, 2015年3月. |
資料番号 |
SP2014-172 |
発行日 |
2015-02-23 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2014-109 SIP2014-150 SP2014-172 |