講演名 2013-11-22
タイトル舌特徴空間における言語学習者の違いを比較するための正規化とマッチング手法(オーガナイズドセッション「音声情報処理技術を利用した第二言語の教育・学習支援」,合成,生成,韻律,音声一般)
守屋 周祐, 矢口 勇一, 照沼 直樹, 佐藤 綜洋, ウィルソン イアン,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究は発声の違いを舌の動きから抽出し,数値化することで,L1スピーカーとL2スピーカーの違いを見つけることが主な目的である.舌の動きの違いは,発声者の発音の違いに直接影響する.そのことから,発声者の母国を特定したり,L2スピーカーが苦労する発音の克服をL1スピーカーの舌の動きと直接比較することが出来るため,適切なアプローチで指導できると考える.それを達成するにあたり,我々は超音波を用いた舌の断面映像を使用し,以下の手法を用いた.まず,対象とするスピーカーから,『The boy who cried wolf』の文を用いて,舌の超音波画像を撮影し,撮像された舌の動きから,Histogram of Oriented Gradients法を用いて,移動情報をベクトルとして抽出する.次に,移動情報から得られたベクトルをKL展開によって次元圧縮する.この時,舌の動く起点となるベクトルとその他のベクトルとの差の平均を求め,そのベクトルの向きを揃えることによってそれらを正規化した後,各フレーム毎の差分ベクトルをDynamic Time Warpingで比較する.実験の結果,空間中に撮影環境や人毎に分割されていた空間においても,その中での移動情報を比較することが出来るようになった.
抄録(英) The main purpose of this research is specifying the articulation difference between L1 and L2 speakers by digitizing tongue motions and analyzing their differences between utterances. Differences in tongue motion directly influence speakers' pronounciation, so it may be possible to determine a speaker's L1 from tongue motion data. By comparing L1 and L2 speakers' tongue motion, we can also guide L2 speakers to improve their L2 pronouncition. In this research, we use coronal cross sections of the tongue taken by an ultrasound scanner to carry out the following: first, record the ultrasound of a speaker's tongue motion using the story "The Boy Who Cried Wolf." Then, sample mobility information by using histogram of oriented gradients. Next, use Karhunen-Loeve expansion to reduce the vector dimensions. At this time, we get the average difference between the starting vector of tongue motion and the subsequent vectors, then normalize the direction of the two averages. Finally, we use dynamic time warping to compare each vector per frame. The experiment results allowed us to compare speakers' tongue mobility information in words which were recorded in different experiment environments or by different speaker.
キーワード(和) 超音波舌画像 / 舌特徴空間 / 類似度 / 動的時間伸縮法
キーワード(英) Ultrasound Tongue Image / Midsagittal Ultrasound Tongue Image Space / Suitabel Subspace / Dynamic Time Warping
資料番号 SP2013-80
発行日

研究会情報
研究会 SP
開催期間 2013/11/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) タイトル舌特徴空間における言語学習者の違いを比較するための正規化とマッチング手法(オーガナイズドセッション「音声情報処理技術を利用した第二言語の教育・学習支援」,合成,生成,韻律,音声一般)
サブタイトル(和)
タイトル(英) Normalization and matching routine for comparing first and second language tongue trajectories
サブタイトル(和)
キーワード(1)(和/英) 超音波舌画像 / Ultrasound Tongue Image
キーワード(2)(和/英) 舌特徴空間 / Midsagittal Ultrasound Tongue Image Space
キーワード(3)(和/英) 類似度 / Suitabel Subspace
キーワード(4)(和/英) 動的時間伸縮法 / Dynamic Time Warping
第 1 著者 氏名(和/英) 守屋 周祐 / Shusuke MORIYA
第 1 著者 所属(和/英) 会津大学
University of Aizu
第 2 著者 氏名(和/英) 矢口 勇一 / Yuichi YAGUCHI
第 2 著者 所属(和/英) 会津大学
University of Aizu
第 3 著者 氏名(和/英) 照沼 直樹 / Naoki TERUNUMA
第 3 著者 所属(和/英) 会津大学
University of Aizu
第 4 著者 氏名(和/英) 佐藤 綜洋 / Takahiro SATO
第 4 著者 所属(和/英) 会津大学
University of Aizu
第 5 著者 氏名(和/英) ウィルソン イアン / Ian WILSON
第 5 著者 所属(和/英) 会津大学
University of Aizu
発表年月日 2013-11-22
資料番号 SP2013-80
巻番号(vol) vol.113
号番号(no) 308
ページ範囲 pp.-
ページ数 5
発行日