講演名 2007/12/13
音声認識との統合によるシステム要求検出(一般(ポスターセッション),第9回音声言語シンポジウム)
佐古 淳, 山形 知行, 滝口 哲也, 有木 康雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声をインターフェイスとして用いる際,システムに対してなされた発話か,周りの人間に対してのものかを判別する必要がある.この問題に対し,柔軟な発話を受理可能なものとして,音声認識結果をブースティングによってシステム要求か雑談かを判別する手法の提案を行ってきた.しかし,音声認識結果には認識誤りを含む場合があることから,認識誤りを原因として,システム要求と雑談の判別を誤る場合があった.本稿では,システム要求検出を音声認識の定式化に組み込むことにより,認識仮説まで用いたより高精度な要求検出について述べる.システム要求検出には従来と同様ブースティングを用いる.ただし,ブースティングの出力スコアは確率ではないため,sigmoid関数を用いて疑似確率化することで,音声認識との統合を行った.実験により,従来の認識結果から識別する手法よりも再現率が改善し,適合率0.98,再現率0.94,F値0.96を実現した.
抄録(英) It is necessary to discriminate system requests from human-human conversation speeches for speech user interfaces. We had proposed the boosting method that discriminates system requests from chats based on 1-best result of speech recognition system. This method can retrieve various expressions due to boosting algorithm. However it causes discrimination error when speech recognition results includes keyword mis-recognition. In this paper, we propose the system request detection method that can consider not only 1-best result but also speech recognition hypotheses. The proposed method is formulated incorporating system request detection into speech recognition. Boosting method is employed as system request discrimination model, however its output score is not probability. Thus boosting score is converted into pseudo probability based on sigmoid function in order to integrate system request discrimination and speech recognition. The experimental results showed that 0.98 of precision, 0.94 of recall and 0.96 of F-measure.
キーワード(和) システム要求判別 / ブースティング / sigmoid / 音声認識
キーワード(英) System Request Detection / Boosting / sigmoid / Speech Recognition
資料番号 NLC2007-57,SP2007-120
発行日

研究会情報
研究会 SP
開催期間 2007/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 音声認識との統合によるシステム要求検出(一般(ポスターセッション),第9回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) System Request Discrimination Based on AdaBoost
サブタイトル(和)
キーワード(1)(和/英) システム要求判別 / System Request Detection
キーワード(2)(和/英) ブースティング / Boosting
キーワード(3)(和/英) sigmoid / sigmoid
キーワード(4)(和/英) 音声認識 / Speech Recognition
第 1 著者 氏名(和/英) 佐古 淳 / Atsushi SAKO
第 1 著者 所属(和/英) 神戸大学大学院自然科学研究科
Guraduate School of Science and Technology, Kobe University
第 2 著者 氏名(和/英) 山形 知行 / Tomoyuki YAMAGATA
第 2 著者 所属(和/英) 神戸大学大学院工学研究科
Guraduate School of Engineering, Kobe University
第 3 著者 氏名(和/英) 滝口 哲也 / Tetsuya TAKIGUCHI
第 3 著者 所属(和/英) 神戸大学大学院工学研究科
Guraduate School of Engineering, Kobe University
第 4 著者 氏名(和/英) 有木 康雄 / Yasuo ARIKI
第 4 著者 所属(和/英) 神戸大学大学院工学研究科
Guraduate School of Engineering, Kobe University
発表年月日 2007/12/13
資料番号 NLC2007-57,SP2007-120
巻番号(vol) vol.107
号番号(no) 406
ページ範囲 pp.-
ページ数 6
発行日