講演名 2010-10-08
雑談音声の常時認識による楽曲提案システム(一般セッション,福祉と見守りのための画像・音声処理)
大橋 宏正, 北岡 教英, 原 直, 武田 一哉,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声を連続音声認識システムにより常時認識することによって得られる認識単語列からその場の雰囲気に適切な音楽・楽曲を提案し,再生するシステムを構築した.楽曲を説明するテキストより構築された文書ベクトル空間と,楽曲の音響特徴量を表現する音響ベクトル空間の対応付けを利用することで,大語彙音声認識によって得られた音声認識単語列を音響ベクトル空間へとマッピングする.また,大語彙音声認識ではカバーできない固有名詞などのキーワードをワードスポッティングで認識する.本稿ではシステムの概要と基本的な性能評価の結果と実際の雑談音声への応用に向けた予備実験結果を示す.楽曲のレビューを読み上げた音声を認識した結果による楽曲検索結果と,レビューのテキストを用いた結果との比較により,テキストではMRR値1で検索できたものが,音声認識性能はWER70.55%,ワードスポッティング性能はF値31.58%でもMRR値0.83と比較的良い結果を得た.また,今後の雑談認識の応用の予備的実験を行い,雑談書き起こしからの例を示した.
抄録(英) We developed an ambient system that plays a music suitable for the mood of a human-human conversation using words obtained from a continuous speech recognition system. Using the correspondent between a document space based on the texts related to the musics and an acoustic space that express various audio features, the continuous speech recognition results are mapped to an acoustic space. Proper names, which are not coverd by the continuous speech recognizer, are recognized by a wordspotter. In this paper, we show the result of the perfomance evaluation for the system. For read music review texts, the system obtained in MRR of 0.83, which is not bad, with high WER of 70.55%, not low F measure of 31.58. We also show an example result for chat conversations.
キーワード(和) 連続音声認識システム / 雑談音声認識 / 潜在意味解析
キーワード(英) Continuous Speech Recognition System / Chat Conversation Recognition / Latent Semantic Analysis
資料番号 PRMU2010-99,SP2010-55,WIT2010-43
発行日

研究会情報
研究会 WIT
開催期間 2010/10/1(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Well-being Information Technology(WIT)
本文の言語 JPN
タイトル(和) 雑談音声の常時認識による楽曲提案システム(一般セッション,福祉と見守りのための画像・音声処理)
サブタイトル(和)
タイトル(英) Music recommendation system based on chat speech recognition
サブタイトル(和)
キーワード(1)(和/英) 連続音声認識システム / Continuous Speech Recognition System
キーワード(2)(和/英) 雑談音声認識 / Chat Conversation Recognition
キーワード(3)(和/英) 潜在意味解析 / Latent Semantic Analysis
第 1 著者 氏名(和/英) 大橋 宏正 / Hiromasa OHASHI
第 1 著者 所属(和/英) 名古屋大学大学院情報科学研究科
Graduate School of Information Science, Nagoya University
第 2 著者 氏名(和/英) 北岡 教英 / Norihide KITAOKA
第 2 著者 所属(和/英) 名古屋大学大学院情報科学研究科
Graduate School of Information Science, Nagoya University
第 3 著者 氏名(和/英) 原 直 / Sunao HARA
第 3 著者 所属(和/英) 名古屋大学大学院情報科学研究科
Graduate School of Information Science, Nagoya University
第 4 著者 氏名(和/英) 武田 一哉 / Kazuya TAKEDA
第 4 著者 所属(和/英) 名古屋大学大学院情報科学研究科
Graduate School of Information Science, Nagoya University
発表年月日 2010-10-08
資料番号 PRMU2010-99,SP2010-55,WIT2010-43
巻番号(vol) vol.110
号番号(no) 221
ページ範囲 pp.-
ページ数 6
発行日