講演名 2003/3/20
日本人英語発声に観測される発音上の癖を考慮した音声認識(聴覚,音声,言語とその障害)
大崎 功一, 峯松 信明, 広瀬 啓吉,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 昨今の国際化に伴い、国際会議など国際標準語である英語を用いて意志疎通を図らなければならない場面が急増してきている。このような場面において認識技術の応用を考えた場合、非母国語の認識技術の向上が急務である。非母国語音声認識の性能向上は、音響モデリング、発音辞書、言語モデリング、デコーディングの各処理系にて検討する必要があるが、本研究では音響モデルに焦点を絞って、その性能向上を目指す。我々は以前、習熟度を考慮して各話者の発声に内在する音声学的構造を推定し、それに基づいてモデル適応する方法について提案した。しかし、習熟度の低い話者に対して適用できない、モデル構築の際に導入される音声学的構造に着目していない、という問題点があった。そこで本研究では、日本人英語モデルと日本人日本語モデルをマルチパス化する手法と、日本人英語に現れるスペルに依存した発音の様子をモデル構築に組み込む手法について検討した。
抄録(英) Today's globalization often requires Japanese people to talk in English, which is often seen in international meetings and so on. To apply speech recognition techniques into these situations successfully, improvement of non-native speech recognition has to be realised. The improvement can be achieved by enhancing acoustic models, pronunciation lexicon, language modeles, and/or decoding stragegies independently. In this paper, a research focus is put on the acoustic models. In our previous study, we proposed a technique to enhance MLLR-based adaptation with respect to pronunciation proficiency of the speaker, where proficiency-based phoneme regression trees were generated and used in the adaptation. But this method had several drawbacks. It cannot be applied to speakers with lower proficiency or give any solutions to a problem that the commonly-used top-down state-tying may introduce inadequate phonetic structure into the model set. In this paper, we firstly analyze Japanese English and propose a technique of combining Japanese English acoustic models with Japanese ones. Next, we investigate a new state-tyine technique which considers spellings of vowels as well as left and right phoneme context.
キーワード(和) 非母国語音声認識 / 日本人英語 / 発音習熟度 / マルチパスモデル / スペル
キーワード(英) non-native speech recognition / Japanese English / pronunciation proficiency / multi-path models / spell
資料番号 SP2002-180
発行日

研究会情報
研究会 SP
開催期間 2003/3/20(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 日本人英語発声に観測される発音上の癖を考慮した音声認識(聴覚,音声,言語とその障害)
サブタイトル(和)
タイトル(英) Speech recognition of Japanese English using Japanese specific pronunciation habits
サブタイトル(和)
キーワード(1)(和/英) 非母国語音声認識 / non-native speech recognition
キーワード(2)(和/英) 日本人英語 / Japanese English
キーワード(3)(和/英) 発音習熟度 / pronunciation proficiency
キーワード(4)(和/英) マルチパスモデル / multi-path models
キーワード(5)(和/英) スペル / spell
第 1 著者 氏名(和/英) 大崎 功一 / Koichi OSAKI
第 1 著者 所属(和/英) 東京大学大学院情報理工学系研究科
Graduate School of Information Science and Technology, University of Tokyo
第 2 著者 氏名(和/英) 峯松 信明 / Nobuaki MINEMATSU
第 2 著者 所属(和/英) 東京大学大学院情報理工学系研究科
Graduate School of Information Science and Technology, University of Tokyo
第 3 著者 氏名(和/英) 広瀬 啓吉 / Keikichi HIROSE
第 3 著者 所属(和/英) 東京大学大学院新領域創成科学研究科
Graduate School of Frontier Sciences, University of Tokyo
発表年月日 2003/3/20
資料番号 SP2002-180
巻番号(vol) vol.102
号番号(no) 749
ページ範囲 pp.-
ページ数 6
発行日