講演名 2008-12-10
音声の高速再生のための話速推定法と高速発話時の特性解析 : 話速バリエーション型データベースの活用例(ポスターセッション,第10回音声言語シンポジウム)
吉原 亨, 蔦木 圭悟, 高橋 弘太,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) できるだけ聞き落としを生じることなく,時間的な効率を上げて音声再生を行うためには,個々の音声に対して最適な再生速度を決定するための指標が必要となる.本稿では,この問題に関して得られた2つの成果について発表する.第一の成果は,2つの異なる狭帯域エネルギの時間変化に着目した話速推定法を提案し,正規化した誤差で16%の推定精度で話速推定が行えることを示したことである.第二の成果は,通常発話の音声と高速発話の音声を,それぞれ極めて速い話速に話速変換した結果を観察し,高速発話を話速変換した音声が,より調波構造の乱れが少ないことを示したことである.本稿は,我々で製作している話速バリエーション型音声データベース(SRV-DB)を用いて行った.我々は本研究をSRV-DBの有効な利用法の一例として発表する.
抄録(英) A quantitative index is needed to estimate the optimum reproduction speed for high speed reproduction of various voices without missing voices. In this paper, we report two results concerning this problem. As the first result, we propose a method for estimating speaking rate and show that we can estimate the speaking rate with 16% of root mean squared error using proposed method. As the second result, we show that the higher conversion rate becomes, the larger the inconsistency of the harmonic structure of a voice become. In this study, we have used a newly constructed speech data base called SRV-DB. We intend to announce this paper as a practical example of the SRV-DB.
キーワード(和) 話速推定 / 話速変換 / 音声データベース
キーワード(英) estimate speaking rate / speaking rate conversion / speech data base
資料番号 NLC2008-63,SP2008-118
発行日

研究会情報
研究会 NLC
開催期間 2008/12/2(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 音声の高速再生のための話速推定法と高速発話時の特性解析 : 話速バリエーション型データベースの活用例(ポスターセッション,第10回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Speaking rate estimation and utterance analysis of fast speech for high-speed reproduction : A practical example of speech database with speaking rate variations
サブタイトル(和)
キーワード(1)(和/英) 話速推定 / estimate speaking rate
キーワード(2)(和/英) 話速変換 / speaking rate conversion
キーワード(3)(和/英) 音声データベース / speech data base
第 1 著者 氏名(和/英) 吉原 亨 / Toru YOSHIHARA
第 1 著者 所属(和/英) 電気通信大学情報通信工学科
Department of Infomation and Communication Engineering, The University of Electro-Communications
第 2 著者 氏名(和/英) 蔦木 圭悟 / Keigo TSUTAKI
第 2 著者 所属(和/英) 電気通信大学情報通信工学科
Department of Infomation and Communication Engineering, The University of Electro-Communications
第 3 著者 氏名(和/英) 高橋 弘太 / Kota TAKAHASHI
第 3 著者 所属(和/英) 電気通信大学情報通信工学科
Department of Infomation and Communication Engineering, The University of Electro-Communications
発表年月日 2008-12-10
資料番号 NLC2008-63,SP2008-118
巻番号(vol) vol.108
号番号(no) 337
ページ範囲 pp.-
ページ数 6
発行日