講演名 2003/12/11
大人・子供に適応した音声情報案内のためのユーザ自動識別(第5回音声言語シンポジウム : ポスターセッション)
西村 竜一, 中村 敬介, 李 晃, 猿渡 洋, 鹿野 清宏,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では,音声インタフェースにおけるユーザ年齢層に応じた柔軟な対話処理の実現を目指して,話者の大人・子供識別手法を検討する.これまでの大人ユーザをターゲットとする音声認識では子供発話の認識は困難であった.しかし,家庭や公共施設雀への音声インタフェースの導入を考えると子供の存在は無視できない.子供発話を扱うための音声認識と音声インタフェースの改良が求められる.提案手法では,.大人・子供に適応した音声情報案内の実装に必要な話者識別手段として,音声認識結果の対数尤度から求める音響的特徴と言語的特徴を併用した統計学習に基づく識別手法を実装する.二値分類アルゴリズムであるSVM(Support Vector Machine)を識別に用いた実験では91.8%の識別率を得た.これは音響的特徴のみを含むGMM(Gaussian Mixture Model)の尤度比較を使った識別結果から5.4%の識別率改善である.本研究ではフィールドテストをすすめている生駒市コミュニティセンターの音声情報案内システム「たけまるくん」をプラットホームとしており,実験にはそのフィールドテスト収集発話を用いた.また,子供収集発話を音声認識モデル構築に含めることで子供認識精度の向上を試みており,その結果も報告する.
抄録(英) This paper describes necessities of flexible spoken dialogues to both adult and child users. The conventional speech recognition program, which is developed on adult utterances, can not recognize child utterances correctly. It becomes impossible to disregard the increase of child users when the system is installed in a home or a public place. To realize the flexibility according to the user's age group, an automatic approach discriminating speakers between adult and child users is necessary. We propose a novel discrimination method on the basis of a statistical learning. As for parameter vectors in the algorithm, acoustic and linguistic properties extracted from speech recognition logarithm likelihood are adopted. Although GMM-based recognition uses only acoustic properties, this method can also consider linguistic properties. In the experiments with the SVM-based screening, we obtained 91.8% discrimination rate to the actual users' utterances. 5.4% improvement is shown as comparison with the GMM-based recognition. Our research platform "Takemaru-kun" system is a real world spoken guidance system located at the Ikoma-city Community Center. The system aims at a long-term field test of a speech interface and collecting actual users' utterance. To improve child speech recognition precisions, collected utterances are applied in training recognition models. Evaluation results of child speech recognition accuracy are also described in this paper.
キーワード(和) 公共型音声情報案内システム / 子供発話認識 / 大人・子供ユーザ識別 / 音声認識スコア
キーワード(英) Public spoken guidance system / Child speech recognition / Adult and child discrimination / Speech recognition scores
資料番号 SP2003-129
発行日

研究会情報
研究会 SP
開催期間 2003/12/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 大人・子供に適応した音声情報案内のためのユーザ自動識別(第5回音声言語シンポジウム : ポスターセッション)
サブタイトル(和)
タイトル(英) Adult and Child Discrimination for Flexible Spoken Guidance System
サブタイトル(和)
キーワード(1)(和/英) 公共型音声情報案内システム / Public spoken guidance system
キーワード(2)(和/英) 子供発話認識 / Child speech recognition
キーワード(3)(和/英) 大人・子供ユーザ識別 / Adult and child discrimination
キーワード(4)(和/英) 音声認識スコア / Speech recognition scores
第 1 著者 氏名(和/英) 西村 竜一 / Ryuichi NISIMURA
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 中村 敬介 / Keisuke NAKAMURA
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 3 著者 氏名(和/英) 李 晃 / Akinobu LEE
第 3 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 4 著者 氏名(和/英) 猿渡 洋 / Hiroshi SARUWATARI
第 4 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 5 著者 氏名(和/英) 鹿野 清宏 / Kiyoshiko SHIKANO
第 5 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
発表年月日 2003/12/11
資料番号 SP2003-129
巻番号(vol) vol.103
号番号(no) 519
ページ範囲 pp.-
ページ数 6
発行日