講演名 2002/10/23
VCML Player 字幕生成のための笑い声の検出
栗田 将史, 鈴木 隆広, 杉山 雅英,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 放送や映画などにおける字幕表示の必要性は本来聴覚障害者が情報を獲得したり、娯楽として楽しむためにある。しかし、現在の字幕の中心は言語音であり音響情景音の自動表示の研究は皆無である。聴覚障害者は日常の生活においてもこの音響情景音を気にしており、その表示を要望している。本報告では字幕音響情景音の1つである「笑い声」に注目し、VQ識別器を用いた自動検出の評価を行った。実験結果より「笑い声」は継続した音として捉えることができるため、継続時間情報を考慮に入れることによって性能の改善が得られること、オープンデータに対しては音響伝達特性の違いが検出に大きく影響していること、その正規化によって性能が改善できることを示した。最後に我々が開発を行っている字幕表示の記述言語であるVCMLとその表示システムであるVCML Playerへの情景音の字幕表示の組込みについて述べる。
抄録(英) Generally speaking, captions in the broadcast and movies are designed for hearing-impaired people to acquire disaster information, business information and enjoy itself as amusement. However, researches on the conventional broadcasting with captions covers only linguistic contents, but do not cover auditory information. Hearing-impaired people strongly desire to get auditory information; laughter, applause, descriptive sounds, clapping, etc. This paper describes the VQ classifier-based laughter detection in speech data and the evaluation experiment experiments. The results of experiments show that the detection with time duration information gives high detection accuracy and the normalization technique of acoustic transfer characteristics improves the laughter detection accuracy for open data. The implementation of laughter display into VCML is described.
キーワード(和) 字幕 / 笑い声検出 / 音響情景音 / VQ識別器 / 継続時間
キーワード(英) Video Caption / Laughter Detection / Auditory Scene / VQ Classifier / Duration
資料番号 WIT2002-36
発行日

研究会情報
研究会 WIT
開催期間 2002/10/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Well-being Information Technology(WIT)
本文の言語 JPN
タイトル(和) VCML Player 字幕生成のための笑い声の検出
サブタイトル(和)
タイトル(英) Laughter Detection for VCML Player Caption Generation
サブタイトル(和)
キーワード(1)(和/英) 字幕 / Video Caption
キーワード(2)(和/英) 笑い声検出 / Laughter Detection
キーワード(3)(和/英) 音響情景音 / Auditory Scene
キーワード(4)(和/英) VQ識別器 / VQ Classifier
キーワード(5)(和/英) 継続時間 / Duration
第 1 著者 氏名(和/英) 栗田 将史 / Masafumi KURITA
第 1 著者 所属(和/英) 会津大学大学院コンピュータ理工学研究科
Graduate School of Computer Science and Engineering, The Univ. of Aizu
第 2 著者 氏名(和/英) 鈴木 隆広 / Takahiro SUZUKI
第 2 著者 所属(和/英) 会津大学大学院コンピュータ理工学研究科
Graduate School of Computer Science and Engineering, The Univ. of Aizu
第 3 著者 氏名(和/英) 杉山 雅英 / Masahide SUGIYAMA
第 3 著者 所属(和/英) 会津大学大学院コンピュータ理工学研究科
Graduate School of Computer Science and Engineering, The Univ. of Aizu
発表年月日 2002/10/23
資料番号 WIT2002-36
巻番号(vol) vol.102
号番号(no) 419
ページ範囲 pp.-
ページ数 6
発行日