電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2015-12-02 11:15
音声波形加工に基づく非母語音声の継続長補正法の評価と分析
倶羅真也高道慎之介奈良先端大)・戸田智基奈良先端大/名大)・ニュービッグ グラムサクティ サクリアニ中村 哲奈良先端大
技報オンラインサービス実施中
抄録 (和) 言語学習等への応用を見据え,非母語話者により発話された音声に対して,発話リズムを補正する技術が研究されている.代表的な手法として,母語話者の音声を参照音声として,動的時間伸縮を用いて音声特徴量系列を変形することで,補正音声を合成する枠組みが提案されている.柔軟な発話リズム補正が可能となる一方で,音声分析合成処理による音質劣化は避けられない.
本稿では,音声分析合成処理による音質劣化を回避する補正法として,動的時間伸縮と音声波形加工処理による発話リズム補正法を提案する.時間伸縮規則を獲得する際には,統計的声質変換を適用することで,話者性の差異が音声スペクトルパラメータに与える影響を緩和するとともに,非母語話者音声に見られる音素挿入誤りにも対処する.
日本語母語話者による英語音声(日本人英語)を用いた実験的評価から,提案法により,音質劣化を緩和しつつ,より自然な継続長を持つ英語音声を合成できることを示す.また,時間伸縮により生じる局所的な音質劣化の影響について,音声スペクトルパラメータの変調スペクトルを用いて分析する. 
(英) There are several attempts at correcting durational patterns of non-native speech towards language learning. One of the typical approaches modifies a speech parameter sequence with Dynamic Time Warping (DTW) using native speech as the reference, generating corrected speech from the modified speech parameter sequence. Although this approach makes it possible to flexibly modify durational patterns of non-native speech, quality of the corrected speech significantly degrades due to the use of analysis-synthesis process to generate the corrected speech.
In this report, we propose a method for correcting durational patterns using direct waveform modification for performing DTW. In calculating a temporal warping function, statistical voice conversion is effectively used to reduce an adverse effect caused by speaker differences. Moreover, phoneme insertion often observed in non-native speech is also handled.
We conducted an experimental evaluation using English speech read by Japanese, demonstrating that the proposed method was capable of flexibly modifying durational patterns while avoiding quality degradation caused by the analysis-synthesis process. Furthermore, waveform segments suffering from quality degradation caused by temporal warping was analyzed using the modulation spectrum of spectral parameters.
キーワード (和) 非母語音声 / 継続長補正 / 動的時間伸縮 / 波形加工 / 変調スペクトル / / /  
(英) non-native speech / correction of durational patterns / dynamic time warping / waveform modification / modulation spectrum / / /  
文献情報 信学技報, vol. 115, no. 346, SP2015-73, pp. 19-24, 2015年12月.
資料番号 SP2015-73 
発行日 2015-11-25 (SP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
査読に
ついて
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります.

研究会情報
研究会 NLC IPSJ-NL SP IPSJ-SLP  
開催期間 2015-12-02 - 2015-12-04 
開催地(和) 名古屋工業大学 
開催地(英) Nagoya Inst of Tech. 
テーマ(和) 第2回自然言語処理シンポジウム & 第17回音声言語シンポジウム 
テーマ(英) The Second Natural Language Processing Symposium & The 17th Spoken Language Symposium 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2015-12-NLC-NL-SP-SLP 
本文の言語 日本語 
タイトル(和) 音声波形加工に基づく非母語音声の継続長補正法の評価と分析 
サブタイトル(和)  
タイトル(英) Evaluation and Analysis of Duration Correction for Non-Native Speech Based on Waveform Modification 
サブタイトル(英)  
キーワード(1)(和/英) 非母語音声 / non-native speech  
キーワード(2)(和/英) 継続長補正 / correction of durational patterns  
キーワード(3)(和/英) 動的時間伸縮 / dynamic time warping  
キーワード(4)(和/英) 波形加工 / waveform modification  
キーワード(5)(和/英) 変調スペクトル / modulation spectrum  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 倶羅 真也 / Shinya Kura / クラ シンヤ
第1著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第2著者 氏名(和/英/ヨミ) 高道 慎之介 / Shinnosuke Takamichi / タカミチ シンノスケ
第2著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第3著者 氏名(和/英/ヨミ) 戸田 智基 / Tomoki Toda / トダ トモキ
第3著者 所属(和/英) 奈良先端科学技術大学院大学/名古屋大学 (略称: 奈良先端大/名大)
Nara Institute of Science and Technology/Nagoya University (略称: NAIST/Nagoya Univ.)
第4著者 氏名(和/英/ヨミ) ニュービッグ グラム / Graham Neubig / ニュービッグ グラム
第4著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第5著者 氏名(和/英/ヨミ) サクティ サクリアニ / Sakriani Sakti / サクリアニ サクティ
第5著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第6著者 氏名(和/英/ヨミ) 中村 哲 / Satoshi Nakamura / ナカムラ サトシ
第6著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2015-12-02 11:15:00 
発表時間 25 
申込先研究会 SP 
資料番号 IEICE-SP2015-73 
巻番号(vol) IEICE-115 
号番号(no) no.346 
ページ範囲 pp.19-24 
ページ数 IEICE-6 
発行日 IEICE-SP-2015-11-25 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会