講演名 2014-02-28
世界諸英語分類のための構造的表象を用いた発音距離予測(一般,時系列パターン認識,一般)
笠原 駿, 峯松 信明, 沈 涵平, 牧野 武彦, 齋藤 大輔, 広瀬 啓吉,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 国際語として利用されている英語の様態を指し示す言葉として世界諸英語がある。発音の観点から世界諸英語を説明すれば、「英語には標準的な発音は存在せず、各国、地域、更には個人が各々異なった発音を有する」現状をそのまま受入れることを意味する。このような価値観に立てば、話者本人の英語発音が世界諸英語の中でどのように位置づけられるかを知ることは有益である。本研究では、個人を単位とした世界諸英語発音分類を念頭に置き、任意の二話者間の英語発音距離(英語訛りの違いの度合い)を、入力音声のみから自動で予測することを試みた。性別や年齢などによって音声特徴は変形するが、この変形に対し不変量となる構造的表象とサポートベクター回帰を用いて、発音距離を予測した。本稿では、回帰モデル学習を、話者対openな学習・評価データセット、話者openな学習・評価データセットを用いる二通りの条件下で行ない、各々の予測性能を検証した。実験の結果、話者対open条件では完全音素認識器を超える予測精度を持つことが示されたが、話者open条件では精度が低いことが示された。未知話者間の発音距離を予測するためには、さらなる改善が必要である。
抄録(英) The term of World Englishes is often used to indicate the current state of English as international language. It claims that English does not have the standard pronunciation and that every country, region, and even individual uses different pronunciations. From the viewpoint of World Englishes, it will be much more important to let each speaker know how his/her pronunciation is located in the diversity of World Englishes pronunciations, not how his/her pronunciation is incorrect compared to native pronunciations. This study tries to predict inter-speaker pronunciation distances only by speech analysis to examine the possibility of individual-basis pronunciation clustering of World Englishes. Speech features are often altered by non-linguistic factors such as age and gender differences. Considering this, the pronunciation structure, known as speaker-invariant feature, and support vector regression were applied for prediction. In the experiments, two conditions of a speaker-pair-open mode and a speaker-open mode were examined for training and testing the SVR. As a result, although a striking performance was obtained in the speaker-pair-open mode, only insufficient performances were found in the speaker-open mode. To predict pronunciation distances between unknown speakers, a further investigation is required.
キーワード(和) 世界諸英語 / 発音分類 / 構造的表象 / サポートベクター回帰 / 話者対open / 話者open
キーワード(英) World Englishes / pronunciation clustering / structural representation / support vector regression / speaker-pair-open / speaker-open
資料番号 SP2013-109
発行日

研究会情報
研究会 SP
開催期間 2014/2/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 世界諸英語分類のための構造的表象を用いた発音距離予測(一般,時系列パターン認識,一般)
サブタイトル(和)
タイトル(英) Prediction of pronunciation distances based on structural representation for clustering World Englishes
サブタイトル(和)
キーワード(1)(和/英) 世界諸英語 / World Englishes
キーワード(2)(和/英) 発音分類 / pronunciation clustering
キーワード(3)(和/英) 構造的表象 / structural representation
キーワード(4)(和/英) サポートベクター回帰 / support vector regression
キーワード(5)(和/英) 話者対open / speaker-pair-open
キーワード(6)(和/英) 話者open / speaker-open
第 1 著者 氏名(和/英) 笠原 駿 / Shun KASAHARA
第 1 著者 所属(和/英) 東京大学
The university of Tokyo
第 2 著者 氏名(和/英) 峯松 信明 / Nobuaki MINEMATSU
第 2 著者 所属(和/英) 東京大学
The university of Tokyo
第 3 著者 氏名(和/英) 沈 涵平 / Han-Ping SHEN
第 3 著者 所属(和/英) 国立成功大学
National Cheng Kung University
第 4 著者 氏名(和/英) 牧野 武彦 / Takehiko MAKINO
第 4 著者 所属(和/英) 中央大学
Chuo University
第 5 著者 氏名(和/英) 齋藤 大輔 / Daisuke SAITO
第 5 著者 所属(和/英) 東京大学
The university of Tokyo
第 6 著者 氏名(和/英) 広瀬 啓吉 / Keikichi HIROSE
第 6 著者 所属(和/英) 東京大学
The university of Tokyo
発表年月日 2014-02-28
資料番号 SP2013-109
巻番号(vol) vol.113
号番号(no) 452
ページ範囲 pp.-
ページ数 6
発行日