講演名 2015-01-22
日本人英語発声を対象とした単語明瞭度の自動予測 : 特徴量とモデルに関する比較研究(時系列データ処理,音声一般)
ポンキッティパン ティーラポン, 峯松 信明, 牧野 武彦, 齋藤 大輔, 広瀬 啓吉,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 日本語訛りを有する英語音声に対して、どの単語が、米語母語話者にとって聞き取り難くなってしまうのかを自動予測することを検討している。本研究では、ERJ intelligibilityデータベースを用いている。これは、日本人によって発声された800文発声が、173名の米語母語話者によって聴取、書き取られ、各単語毎に聴取率が定義されている。先行研究において、入力テキストあるいは入力音声に対する聴取率予測器を構築した。そこでは、入力テキストから抽出される言語的特徴や、入力音声から抽出される音声学的発音距離や単語の混同性を計算し、CARTを使って聴取率の予測を行なった。本研究では、新たな特徴として韻律的特徴を検討し、また、予測モデルとしては新たに三種類のモデル(Adaboost、Random Forest、Extremely Randomized Trees)を検討した。評価実験として「非常に聞き取り難くなる単語」の同定、「やや聞き取り難くなる単語」の同定を行なった。その結果、両タスクにおいてF1スコアが72.74%、84.78%となり、良好な結果を得ることができた。
抄録(英) This study investigates automatic prediction of the words in given sentences that will be unintelligible to American listeners when they are pronounced with Japanese accents. The ERJ intelligibility database contains results of a large listening test, where 800 English sentences read with Japanese accents were presented to 173 American listeners and correct perception rate was obtained for each spoken word. By using this database, in our previous study, an intelligibility predictor was built for each word of input texts or utterances. For prediction, lexical and linguistic features were extracted from texts and pronunciation distance and word confusability were calculated from utterances. CART was used as prediction model. In this paper, new features that are related to speech prosody and three new prediction models of ensemble methods (Adaboost, Random Forest and Extremely Randomized Trees) are tested and compared to the old features and model. Finally, our new system can predict very unintelligible and rather unintelligible words with F1-scores of 72.74% and 84.78%, respectively.
キーワード(和) 明瞭度 / 日本人英語データベース / 韻律的特徴 / 機械学習 / 国際音声記号 / 第二言語 / 外国訛り
キーワード(英) spoken word intelligibility / ERJ database / prosodic features / machine learning / IPA / L2 learning / foreign accent
資料番号 SP2014-132
発行日

研究会情報
研究会 SP
開催期間 2015/1/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 ENG
タイトル(和) 日本人英語発声を対象とした単語明瞭度の自動予測 : 特徴量とモデルに関する比較研究(時系列データ処理,音声一般)
サブタイトル(和)
タイトル(英) Automatic prediction of intelligibility of English words spoken with Japanese accents : Comparative study of features and models used for prediction
サブタイトル(和)
キーワード(1)(和/英) 明瞭度 / spoken word intelligibility
キーワード(2)(和/英) 日本人英語データベース / ERJ database
キーワード(3)(和/英) 韻律的特徴 / prosodic features
キーワード(4)(和/英) 機械学習 / machine learning
キーワード(5)(和/英) 国際音声記号 / IPA
キーワード(6)(和/英) 第二言語 / L2 learning
キーワード(7)(和/英) 外国訛り / foreign accent
第 1 著者 氏名(和/英) ポンキッティパン ティーラポン / Teeraphon PONGKITTIPHAN
第 1 著者 所属(和/英) 東京大学工学部
Faculty of Engineering, The University of Tokyo
第 2 著者 氏名(和/英) 峯松 信明 / Nobuaki MINEMATSU
第 2 著者 所属(和/英) 東京大学工学部
Faculty of Engineering, The University of Tokyo
第 3 著者 氏名(和/英) 牧野 武彦 / Takehiko MAKINO
第 3 著者 所属(和/英) 中央大学経済学部
Faculty of Economics, Chuo University
第 4 著者 氏名(和/英) 齋藤 大輔 / Daisuke SAITO
第 4 著者 所属(和/英) 東京大学工学部
Faculty of Engineering, The University of Tokyo
第 5 著者 氏名(和/英) 広瀬 啓吉 / Keikichi HIROSE
第 5 著者 所属(和/英) 東京大学工学部
Faculty of Engineering, The University of Tokyo
発表年月日 2015-01-22
資料番号 SP2014-132
巻番号(vol) vol.114
号番号(no) 411
ページ範囲 pp.-
ページ数 6
発行日