講演抄録/キーワード |
講演名 |
2010-10-08 15:50
雑談音声の常時認識による楽曲提案システム ○大橋宏正・北岡教英・原 直・武田一哉(名大) PRMU2010-99 SP2010-55 WIT2010-43 |
抄録 |
(和) |
音声を連続音声認識システムにより常時認識することによって得られる認識単語列から
その場の雰囲気に適切な音楽・楽曲を提案し,再生するシステムを構築した.
楽曲を説明するテキストより構築された文書ベクトル空間と,
楽曲の音響特徴量を表現する音響ベクトル空間の対応付けを利用することで,
大語彙音声認識によって得られた音声認識単語列を音響ベクトル空間へとマッピングする.
また,大語彙音声認識ではカバーできない固有名詞などのキーワードを
ワードスポッティングで認識する.
本稿ではシステムの概要と基本的な性能評価の結果と
実際の雑談音声への応用に向けた予備実験結果を示す.
楽曲のレビューを読み上げた音声を認識した結果による楽曲検索結果と,
レビューのテキストを用いた結果との比較により,テキストではMRR値1で検索できたものが,
音声認識性能はWER70.55\%,ワードスポッティング性能はF値31.58\%でも
MRR値0.83と比較的良い結果を得た.また,今後の雑談認識の応用の予備的実験を行い,
雑談書き起こしからの例を示した. |
(英) |
We developed an ambient system that plays a music suitable for the mood of a human-human conversation
using words obtained from a continuous speech recognition system.
Using the correspondent between a document space based on the texts related to the musics and
an acoustic space that express various audio features,
the continuous speech recognition results are mapped to an acoustic space.
Proper names, which are not coverd by the continuous speech recognizer,
are recognized by a wordspotter.
In this paper, we show the result of the perfomance evaluation for the system.
For read music review texts, the system obtained in MRR of 0.83, which is not bad, with high WER of 70.55\%, not low F measure of 31.58.
We also show an example result for chat conversations. |
キーワード |
(和) |
連続音声認識システム / 雑談音声認識 / 潜在意味解析 / / / / / |
(英) |
Continuous Speech Recognition System / Chat Conversation / Latent Semantic Analysis / / / / / |
文献情報 |
信学技報, vol. 110, no. 220, SP2010-55, pp. 59-64, 2010年10月. |
資料番号 |
SP2010-55 |
発行日 |
2010-10-01 (PRMU, SP, WIT) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2010-99 SP2010-55 WIT2010-43 |
研究会情報 |
研究会 |
PRMU SP WIT |
開催期間 |
2010-10-08 - 2010-10-09 |
開催地(和) |
幕張メッセ(CEATEC会場) |
開催地(英) |
|
テーマ(和) |
福祉と見守りのための画像・音声処理 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2010-10-PRMU-SP-WIT |
本文の言語 |
日本語 |
タイトル(和) |
雑談音声の常時認識による楽曲提案システム |
サブタイトル(和) |
|
タイトル(英) |
Music recommendation system based on chat speech recognition |
サブタイトル(英) |
|
キーワード(1)(和/英) |
連続音声認識システム / Continuous Speech Recognition System |
キーワード(2)(和/英) |
雑談音声認識 / Chat Conversation |
キーワード(3)(和/英) |
潜在意味解析 / Latent Semantic Analysis |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
大橋 宏正 / Hiromasa Ohashi / オオハシ ヒロマサ |
第1著者 所属(和/英) |
名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.) |
第2著者 氏名(和/英/ヨミ) |
北岡 教英 / Norihide Kitaoka / キタオカ ノリヒデ |
第2著者 所属(和/英) |
名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.) |
第3著者 氏名(和/英/ヨミ) |
原 直 / Sunao Hara / ハラ スナオ |
第3著者 所属(和/英) |
名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.) |
第4著者 氏名(和/英/ヨミ) |
武田 一哉 / Kazuya Takeda / タケダ カズヤ |
第4著者 所属(和/英) |
名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2010-10-08 15:50:00 |
発表時間 |
30分 |
申込先研究会 |
SP |
資料番号 |
PRMU2010-99, SP2010-55, WIT2010-43 |
巻番号(vol) |
vol.110 |
号番号(no) |
no.219(PRMU), no.220(SP), no.221(WIT) |
ページ範囲 |
pp.59-64 |
ページ数 |
6 |
発行日 |
2010-10-01 (PRMU, SP, WIT) |
|