講演名 2014-01-24
特定話者に対するパラ言語情報の認識(オーガナイズドセッション「多様な音声の認識・合成へ向けて」,音声,言語,対話,一般)
島川 智行, 山下 洋一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,特定話者におけるパラ言語情報の認識を検討する.特定のユーザが,パラ言語情報を利用した音声対話システムなどを使う状況においては,特定話者においてよりよい精度で認識をする必要がある.そのため,本研究では特定話者におけるパラ言語情報の認識について検討する.パラ言語情報を意図した発話を収録し,人間が知覚できたパラ言語情報のうち,不満,疑問,驚きの3つの感情について自動認識を試みた.単一パラメータを用いる識別器の出力を重み付き加算して認識結果を得る手法によって,約70%の認識率を得た.学習に用いるデータの条件を変え,話者1名の発話を学習した場合と,複数話者の発話を学習した場合での認識結果の比較を行った.その結果,学習した話者による結果に違いは見られたが,特定話者での学習と,不特定話者での学習による結果の違いはあまり見られなかった.
抄録(英) This paper discusses about the automatic recognition of paralinguistic information with speaker dependent modeling. When a user uses a spoken dialog system which can use paralinguistic information, it requires high performance of the paralinguistic information recognition for the specific user. We tried to recognize paralinguistic information in a speaker dependent manner. We recorded speech with paralinguistic information, and tried automatic recognition of three kinds of paralinguistic information, dissatisfaction, interrogation, and surprise, which can be perceived in a listening test. The average recognition rate is about 70% by a method based on weighted summation of output from several recognizers which use a single parameter. We tried some conditions of model training, and compared the recognition results with speaker dependent and speaker independent modeling. We could find the difference of recognition for speakers, but we didn't find the larger difference between the speaker dependent and speaker independent modeling.
キーワード(和) パラ言語情報 / 音声対話 / 感情 / 特定話者
キーワード(英) Paralinguistic information / Spoken dialog / Emotion / Speaker Dependent
資料番号 SP2013-103
発行日

研究会情報
研究会 SP
開催期間 2014/1/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 特定話者に対するパラ言語情報の認識(オーガナイズドセッション「多様な音声の認識・合成へ向けて」,音声,言語,対話,一般)
サブタイトル(和)
タイトル(英) Automatic Recognition of Paralinguistic Information with Speaker Dependent Modeling
サブタイトル(和)
キーワード(1)(和/英) パラ言語情報 / Paralinguistic information
キーワード(2)(和/英) 音声対話 / Spoken dialog
キーワード(3)(和/英) 感情 / Emotion
キーワード(4)(和/英) 特定話者 / Speaker Dependent
第 1 著者 氏名(和/英) 島川 智行 / Tomoyuki SHIMAKAWA
第 1 著者 所属(和/英) 立命館大学大学院情報理工学研究科
Graduate school of Information Science and Engineering, Ritsumeikan University
第 2 著者 氏名(和/英) 山下 洋一 / Yoichi YAMASHITA
第 2 著者 所属(和/英) 立命館大学情報理工学部メディア情報学科
Information Science and Engineering, Ritsumeikan University
発表年月日 2014-01-24
資料番号 SP2013-103
巻番号(vol) vol.113
号番号(no) 404
ページ範囲 pp.-
ページ数 6
発行日