お知らせ 研究会の開催と会場に参加される皆様へのお願い(2021年10月開催~)
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2010-07-22 14:20
構造的特徴量に対する多段階の重回帰分析による発音評価
鈴木雅之中村綾乃東大)・喬 宇Shenzhen Institutes)・峯松信明広瀬啓吉東大SP2010-37
抄録 (和) 国際化・情報化が急速に進む現在,コンピュータを用いた語学学習支援が盛んに研究され,教育現場に導入されている.語学学習のうち発音学習の支援には,子供から大人まで様々な声質を持つユーザにも頑健に動作する,精度の高い発音分析法が必要になる.しかし,現在広く用いられているHidden Markov Model (HMM)を利用する発音分析法では,分析結果がユーザの声質とHMMの学習データの声質のミスマッチに影響されて,分析精度の低下をもたらす.近年この問題を解決するために,声質の違いに近似的に不変な音声の構造的表象を利用した発音分析法が提案され,ミスマッチに非常に高い頑健性を持つ発音分析が実現された.しかし,特にミスマッチが小さい場合,HMMを用いる手法に劣っている問題があった.本稿では,音声の構造的表象を用いた発音分析の精度を改善するために,多段階の重回帰分析を提案する.これにより,声質のミスマッチに高い頑健性を保ったまま,ミスマッチの小さい条件でHMMを利用する場合と同等以上の精度が得られた.さらに,提案手法とHMMを用いる手法を適切に組み合わせることで,さらに良好な結果が得られた. 
(英) In the rapid internationalization and informatization, many research efforts have been made to build computer-aided language learning (CALL) systems. Good pronunciation assessment systems should be built using the technologies which can deal with acoustic variabilities found in learners' utterances caused by non-linguistic factors such as age and gender. However, the widely-used acoustic modeling technique of HMM often shows unstable performances with speakers of different ages and genders. Recently, a new method of representing learners' pronunciations with their non-linguistic features effectively removed, called pronunciation structure. In this method, only the contrastive features of speech are extracted. However, the excessively high dimensionality of the structure comes to degrade its performance and, to solve this problem, multilayer regression analysis with structural features is proposed in this paper. The results show much higher correlation between human and machine performances of assessing learners' pronunciations compared to the previously proposed structure-based method. Further, the proposed method shows much higher robustness compared to the widely-used HMM-based method. In this paper, we also propose a good combination of the structure and the HMM.
キーワード (和) 音声の構造的表象 / CALL / 重回帰分析 / GOP / / / /  
(英) speech structure / CALL / regression / GOP / / / /  
文献情報 信学技報, vol. 110, no. 143, SP2010-37, pp. 13-18, 2010年7月.
資料番号 SP2010-37 
発行日 2010-07-15 (SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2010-37

研究会情報
研究会 SP  
開催期間 2010-07-22 - 2010-07-24 
開催地(和) 仙台 秋保温泉 緑水亭 
開催地(英) Ryokusui-tei (Sendai) 
テーマ(和) 認識,理解,対話,一般(SLPと合同(併催)) 
テーマ(英) Recognition, Understanding, Dialogue, etc.(Prallelized with SIG-SLP) 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2010-07-SP 
本文の言語 日本語 
タイトル(和) 構造的特徴量に対する多段階の重回帰分析による発音評価 
サブタイトル(和)  
タイトル(英) Pronunciation assessment based on multilayer multiple regression analysis using structural features 
サブタイトル(英)  
キーワード(1)(和/英) 音声の構造的表象 / speech structure  
キーワード(2)(和/英) CALL / CALL  
キーワード(3)(和/英) 重回帰分析 / regression  
キーワード(4)(和/英) GOP / GOP  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 鈴木 雅之 / Masayuki Suzuki / スズキ マサユキ
第1著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo.)
第2著者 氏名(和/英/ヨミ) 中村 綾乃 / Ayano Nakamura / ナカムラ アヤノ
第2著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo.)
第3著者 氏名(和/英/ヨミ) 喬 宇 / Yu Qiao / チャオ ユウ
第3著者 所属(和/英) The Shenzhen Institutes of Advanced Technology (略称: Shenzhen Institutes)
The Shenzhen Institutes of Advanced Technology (略称: Shenzhen Institutes)
第4著者 氏名(和/英/ヨミ) 峯松 信明 / Nobuaki Minematsu / ミネマツ ノブアキ
第4著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo.)
第5著者 氏名(和/英/ヨミ) 広瀬 啓吉 / Keikichi Hirose / ヒロセ ケイキチ
第5著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo.)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2010-07-22 14:20:00 
発表時間 25 
申込先研究会 SP 
資料番号 IEICE-SP2010-37 
巻番号(vol) IEICE-110 
号番号(no) no.143 
ページ範囲 pp.13-18 
ページ数 IEICE-6 
発行日 IEICE-SP-2010-07-15 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会