講演名 1997/9/12
VQ歪みに基づく放送音の自動分類
河地 吏司, 梶田 将司, 武田 一哉, 板倉 文忠,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声認識はテレビやラジオなどによる放送音も対象とするようになってきた。放送音には複数の話者が同時に話している場合や、音楽やその他の音が重なっている場合など、様々な状況の音が含まれている。このような音の音声認識を行なう場合、予め音の分類ができれば音の種類によって音声認識処理を変更することができる。そこで本研究では、放送音が8つもしくは11の種類に分類できるものとしてVQ歪みによる分類を検討した。フレーム毎に分類を行ない分類率は最高で74.0%となった。また、音声が含まれるか含まれないかの分類では93.6%となった。
抄録(英) Broadcasting sound of TV and radio have been a target for speech recognition. The Broadcasting sound includes various type of sound, for example, overlap music or other sound, simultaneously uttered sound on broadcasting sound and so on. In speech recognition for sound like this if such sound could be classified, the recognition processing can be modified by sound category. In this paper, assuming sound can be classified into eight or eleven category, the classification of broadcasting sound by VQ distortion is described. Frame by frame classification accuracy was 74.0%, and the one for classification of speech or nonspeech was 93.6%
キーワード(和) 放送音の分類 / VQ歪み
キーワード(英) broadcasting sound / VQ distortion
資料番号 SP97-50
発行日

研究会情報
研究会 SP
開催期間 1997/9/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) VQ歪みに基づく放送音の自動分類
サブタイトル(和)
タイトル(英) Automatic Classification of Broadcasting Sound based on VQ Distortion
サブタイトル(和)
キーワード(1)(和/英) 放送音の分類 / broadcasting sound
キーワード(2)(和/英) VQ歪み / VQ distortion
第 1 著者 氏名(和/英) 河地 吏司 / Satoshi KAWACHI
第 1 著者 所属(和/英) 名古屋大学大学院工学研究科
Graduate School of Engineering, Nagoya University
第 2 著者 氏名(和/英) 梶田 将司 / Shoji KAJITA
第 2 著者 所属(和/英) 名古屋大学大学院工学研究科
Graduate School of Engineering, Nagoya University
第 3 著者 氏名(和/英) 武田 一哉 / Kazuya TAKEDA
第 3 著者 所属(和/英) 名古屋大学大学院工学研究科
Graduate School of Engineering, Nagoya University
第 4 著者 氏名(和/英) 板倉 文忠 / Fumitada ITAKURA
第 4 著者 所属(和/英) 名古屋大学大学院工学研究科
Graduate School of Engineering, Nagoya University
発表年月日 1997/9/12
資料番号 SP97-50
巻番号(vol) vol.97
号番号(no) 249
ページ範囲 pp.-
ページ数 6
発行日