講演名 2009-10-30
中村 圭吾, 戸田 智基, 猿渡 洋, 鹿野 清宏,
抄録(和) 本稿では,喉頭摘出者が外部機器を用いた電気音声に対して,統計的声質変換を適用した実験的評価を報告する.用いる外部機器として,1)周囲の者に聴取されないほど微弱な信号を出力する音源,2)従来のモノトーンピッチを出力する電気式人工喉頭,及び3)ユーザが気管孔から出力する呼気圧でF_0を制御する呼気センサーを用いた電気式人工喉頭の3種類を用いる.発声された電気音声は,ヘッドセットマイクロフォンまたはNon-audible murmurマイクロフォンで収録され,ささやき声または通常音声のいずれかに変換される.実験的評価の結果,1)呼気センサーの使用はF_0推定の精度を改善するのに有効である,2)入力F_0を用いる効果は薄いが,声質変換性能は特に劣化しない,3)全ての変換の枠組みおいて自然性が大きく改善し,変換音声は元の電気音声と比べてより好ましいことを確認する.
抄録(英) This paper presents experimental evaluations of statistical voice conversion from artificial speech spoken by a laryngectomee using some external sound source units. The laryngectomee uses three kinds of the external sound source units; 1) a sound source unit that generates quite small source signals that cannot be heard by listeners; 2) a conventional electrolarynx that generates signals with monotone F_0; and 3) an electrolarynx using an air-pressure sensor that enables the laryngectomee to modulate the F_0 of the sound source signal using the air-pressure output from his/her tracheostoma. The generated artificial speech is detected with a headset microphone or Non-audible murmur microphone, and then, it is converted into whispered voice or normal speech uttered by a nonlaryngectomee. The experimental results demonstrate that 1) the use of the air-pressure sensor is effective to improve the voice conversion accuracy, 2) the modulated F_0 using an air-pressure sensor is less effective in F_0 estimation, but it doesn't cause any significant degradation of the voice conversion accuracy, and 3) voice conversion yields significant improvements in naturalness so that the converted speech is much more preferred to the original artificial speech by listeners.
タイトル(和) 外部音源を用いた発声補助システムにおける統計的声質変換の評価(福祉と音声処理,一般)
タイトル(英) An Evaluation of Statistical Voice Conversion in Speaking-Aid Systems Using External Source Signals
