講演名 2015-06-18
自己視点からの世界諸英語クラスタリングを目的とした発音距離予測とその耐雑音性に関する検討
佐藤 惟知(東大), 柏木 陽佑(東大), 笠原 駿(東大), 峯松 信明(東大), 齋藤 大輔(東大), 広瀬 啓吉(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,諸外国から日本を訪れる観光客が増加している.また,2020年には東京オリンピックが行なわれる.彼らとのコミュニケーションは基本,英語となるが,当然様々に訛った英語を話す話者を相手にする必要がある.世界中の様々な英語発音(世界諸英語)に慣れ親しむことを目的として,世界諸英語の発音を話者を単位として自動分類し,可視化する技術を検討している.このためには,任意の二話者間の発音差異を定量的に予測する必要がある.本研究ではこれを,音声の構造的表象に基づく特徴抽出とサポートベクター回帰により実装している.本稿では,1)自己視点からの可視化を想定した発音距離予測と,2)発音距離予測における雑音抑制技術の有効性という2点に着目して実験的検討を行なった.その結果,音素書き起しを使った発音差異計算に相当する精度が得られ,また,10[dB]ほどのSN比があれば,十分な雑音抑制が可能であることが示された.
抄録(英) In recent years,we have more and more international tourists and in 2020, we have Tokyo Olympic Games. For communicating with those tourists, the default language is English but they speak English with various accents. To realize smooth communication with these tourists, we are developing a technical infrastructure to accustom Japanese people to variously accented Englishes (World Englishes). The infrastructure aims at clustering a large diversity of English pronunciations on an individual basis and visualizing the diversity in an educationally effective way. For clustering, a technique is needed that can predict the accent gap between any speaker pair and we developed it by integrating pronunciation structure analysis and support vector regression. In this paper, the prediction performance is evaluated when the prediction technique is applied for visualization using a user's self-centered viewpoint and when it is applied with a noise suppression technique. Results show that the performance is comparable to that observed when we use phonemic, not phonetic, transcripts and that 10 [dB] is enough as SNR to guarantee the prediction performance realized in a clean condition.
キーワード(和) 世界諸英語 / 発音分類 / 構造的表象 / サポートベクター回帰 / 自己視点からの可視化 / 雑音抑制 / DNN
キーワード(英) World Englishes / pronunciation clustering / structural representation / support vector regression / self-centered visualization / noise suppression / DNN
資料番号 PRMU2015-45,SP2015-14,WIT2015-14
発行日 2015-06-11 (PRMU, SP, WIT)

研究会情報
研究会 WIT / SP / ASJ-H / PRMU
開催期間 2015/6/18(から2日開催)
開催地(和) 新潟大学駅南キャンパス「ときめいと」
開催地(英)
テーマ(和) 福祉/音声/聴覚/パターン認識メディア理解一般
テーマ(英)
委員長氏名(和) 布川 清彦(東京国際大) / 間野 一則(芝浦工大) / 赤木 正人(北陸先端大) / 前田 英作(NTT)
委員長氏名(英) Kiyohiko Nunokawa(Tokyo International Univ.) / Kazunori Mano(Shibaura Inst. of Tech.) / Masato Akagi(北陸先端大) / Eisaku Maeda(NTT)
副委員長氏名(和) 和田 親宗(九工大) / 北岡 教英(徳島大) / 古川 茂人(NTT) / 仙田 修司(NEC) / 内田 誠一(九大)
副委員長氏名(英) Chikamune Wada(Kyushu Inst. of Tech.) / Norihide Kitaoka(Tokushima Univ.) / Shigeto Furukawa(NTT) / Shuji Senda(NEC) / Seiichi Uchida(Kyushu Univ.)
幹事氏名(和) 酒向 慎司(名工大) / 梶谷 勇(産総研) / 若月 大輔(筑波技大) / 岩野 公司(東京都市大) / 滝口 哲也(神戸大) / 程島 奈緒(東海大) / 森本 隆司(リオン) / 饗庭 絵里子(電通大) / 大山 航(三重大) / 安倍 満(デンソーアイティーラボラトリ)
幹事氏名(英) Shinji Sakou(Nagoya Inst. of Tech.) / Isamu Kajitani(AIST) / Daisuke Wakatsuki(Tsukuba Univ. of Tech.) / Koji Iwano(Tokyo City Univ.) / Tetsuya Takiguchi(Kobe Univ.) / Nao Hodoshima(東海大) / Takashi Morimoto(リオン) / Eriko Aiba(電通大) / Wataru Ohyama(Mie Univ.) / Mitsuru Anbai(DENSO IT Lab.)
幹事補佐氏名(和) 雨宮 智浩(NTT) / 塩野目 剛亮(筑波技大) / 宮城 愛美(筑波技大) / 能勢 隆(東北大) / 浅見 太一(NTT) / / 近藤 一晃(京大) / 木村 昭悟(NTT)
幹事補佐氏名(英) Tomohiro Amemiya(NTT) / Takeaki Shionome(Tsukuba Univ. of Tech.) / Manabi Miyagi(Tsukuba Univ. of Tech.) / Takashi Nose(Tohoku Univ.) / Taichi Asami(NTT) / / Kazuaki Kondo(Kyoto Univ.) / Akisato Kimura(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Well-being Information Technology / Technical Committee on Speech / * / Technical Committee on Pattern Recognition and Media Understanding
本文の言語 JPN
タイトル(和) 自己視点からの世界諸英語クラスタリングを目的とした発音距離予測とその耐雑音性に関する検討
サブタイトル(和)
タイトル(英) Noise-robust Prediction of Pronunciation Distances Aiming at Clustering of World Englishes Using a Learner's Self-centered Viewpoint
サブタイトル(和)
キーワード(1)(和/英) 世界諸英語 / World Englishes
キーワード(2)(和/英) 発音分類 / pronunciation clustering
キーワード(3)(和/英) 構造的表象 / structural representation
キーワード(4)(和/英) サポートベクター回帰 / support vector regression
キーワード(5)(和/英) 自己視点からの可視化 / self-centered visualization
キーワード(6)(和/英) 雑音抑制 / noise suppression
キーワード(7)(和/英) DNN / DNN
第 1 著者 氏名(和/英) 佐藤 惟知 / Yuichi Sato
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UT)
第 2 著者 氏名(和/英) 柏木 陽佑 / Yosuke Kashiwagi
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UT)
第 3 著者 氏名(和/英) 笠原 駿 / Shun Kasahara
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UT)
第 4 著者 氏名(和/英) 峯松 信明 / Nobuaki Minematsu
第 4 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UT)
第 5 著者 氏名(和/英) 齋藤 大輔 / Daisuke Saito
第 5 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UT)
第 6 著者 氏名(和/英) 広瀬 啓吉 / Keikichi Hirose
第 6 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UT)
発表年月日 2015-06-18
資料番号 PRMU2015-45,SP2015-14,WIT2015-14
巻番号(vol) vol.115
号番号(no) PRMU-98,SP-99,WIT-100
ページ範囲 pp.77-82(PRMU), pp.77-82(SP), pp.77-82(WIT),
ページ数 6
発行日 2015-06-11 (PRMU, SP, WIT)