講演名 | 2005/5/19 感情に関係する特徴量の検討(視聴覚情報処理及び一般) 直井 克也, 松本 哲也, 竹内 義則, 工藤 博章, 大西 昇, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本研究では, 音声に含まれる感情に関係する特徴量の検討を行う.従来の音声感情認識では, ピッチやエネルギーの統計量が特徴量として用いられてきた.しかしながら, これらは言語に依存するという問題がある.そこで, 我々は言語に依存しない音声感情特徴量を見つけることを目標とする.我々は, 周波数空間に着目し, その帯域でのピークを新たな特徴量として提案する.実験は4種類の感情(怒り, 喜び, 悲しみ, 平静)を用い, 2感情識別実験と4感情識別実験を行った.2感情識別実験から, 提案特徴量は, 平静と悲しみの識別には適さないが, 喜びと悲しみの識別には有効であると考えられる.4感情識別実験結果から, 平均58%の識別率を得ることができた.さらに, 喜びの精度が77%であり, 提案特徴量は喜びに適する特徴量であるといえる.また, 繰り返し実験を行うにあたって, 言語を考慮せず学習させたにもかかわらず識別率にほとんど変化がなかったので, 言語に依存しない特徴量であると考えられる. |
抄録(英) | This paper investigates feature values relating to emotion in speech. In conventional studies on recognition of speech emotion, a pitch and energy have been used as feature values. There is, however, problem that these features depend on the length of attended words. Then we aim for finding features of speech emotion which don't depend on words. We propose a new feature value of peaks in frequency domain. We conducted two experiments: two-emotion discrimination and four-emotion discrimination by using four emotions of anger, joy, sadness and normal. From the result of two-emotion discrimination, it is said that the proposed feature does not discriminate between normal and sadness, but does joy and sadness. In the experiment of four emotions, the average discrimination rate is 58%, and the rate for joy is 77%. Although the learning was done without considering the length of speech, there is no change in the discrimination rate. This result shows that the proposed feature doesn't depend on spoken words. |
キーワード(和) | 音声 / 感情認識 / 周波数領域 |
キーワード(英) | signal / emotion recognition / frequency domain / Teager Energy Operator |
資料番号 | HIP2005-7 |
発行日 |
研究会情報 | |
研究会 | HIP |
---|---|
開催期間 | 2005/5/19(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Human Information Processing (HIP) |
---|---|
本文の言語 | JPN |
タイトル(和) | 感情に関係する特徴量の検討(視聴覚情報処理及び一般) |
サブタイトル(和) | |
タイトル(英) | A Study on Feature Values relating to Emotion |
サブタイトル(和) | |
キーワード(1)(和/英) | 音声 / signal |
キーワード(2)(和/英) | 感情認識 / emotion recognition |
キーワード(3)(和/英) | 周波数領域 / frequency domain |
第 1 著者 氏名(和/英) | 直井 克也 / Katsuya NAOI |
第 1 著者 所属(和/英) | 名古屋大学情報科学研究科 Graduate school of Information Science, Nagoya University |
第 2 著者 氏名(和/英) | 松本 哲也 / Tetsuya MATSUMOTO |
第 2 著者 所属(和/英) | 名古屋大学情報科学研究科 Graduate school of Information Science, Nagoya University |
第 3 著者 氏名(和/英) | 竹内 義則 / Yoshinori TAKEUCHI |
第 3 著者 所属(和/英) | 名古屋大学情報セキュリティ対策推進室理化学研究所バイオミメティックコントロール研究センター Information Security Promotion Agency, Nagoya University; BMC Research Center, RIKEN |
第 4 著者 氏名(和/英) | 工藤 博章 / Hiroaki KUDO |
第 4 著者 所属(和/英) | 名古屋大学情報科学研究科 Graduate school of Information Science, Nagoya University |
第 5 著者 氏名(和/英) | 大西 昇 / Noboru OHNISHI |
第 5 著者 所属(和/英) | 名古屋大学情報科学研究科 Graduate school of Information Science, Nagoya University |
発表年月日 | 2005/5/19 |
資料番号 | HIP2005-7 |
巻番号(vol) | vol.105 |
号番号(no) | 99 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |