講演抄録/キーワード |
講演名 |
2012-03-15 11:05
シフトレジスタを用いた音声合成回路における発声過程のモデル化 ○眞鍋慧太・上垣利果・田向 権・関根優年(東京農工大) NC2011-157 |
抄録 |
(和) |
発声器官の形状は筋肉により複雑に変化し,その違いによって,言葉として認識できるような様々な音声が生まれる.我々は,音の伝達・反射・重ね合わせを行う仮想的な物理空間を論理回路でFPGA 内に構成し,音声,筋肉の動きをパルス密度によって表現,それを最終的にニューラルネットで制御することを目指している.これまで声道部分回路のレジスタを3 並列構成とすることで声道内での波の重ね合わせを表現してきた.また,口腔部の広がりをモデル化し,分岐するレジスタを持つように改良を行った.しかしながら,自然な音声は得られていない.本稿では現在のモデルをより精密化し,制御を行うためにモデル化した声道内で起きている物理現象を解析し,以前の合成システムにおいて明らかになっていなかった各調音パラメータとの対応関係について報告する. |
(英) |
The shape of the vocal organ changes by muscle complicatedly, and, by the difference, recognizable various sounds are born as words. We construct a virtual physical space aligning a transmission, a reflection and a stack of sound with a logical circuit in FPGA. In the virtual space, we express the sound and the movement of muscle by pulse density, and aim controlling it by neural network at finally. In our previous work, we expressed the composition of sound wave in the vocal tract by assuming a circuit of vocal tract part constructed by 3 parallel shift register. In addition, we modelled an expanse of oral part by a shift register which diverged from the vocal trac part. However, the previous system did not generate natural voices, and a correspondence with parameter was not clear. To overcome the problem, we refine the previous model and then analyze a physical phenomenon in the vocal trac circuit to control the proposed model. Finally, we report correspondency with each parameter based on the analysis. |
キーワード |
(和) |
音声合成 / パルス密度 / 声道モデル / 発声過程 / FPGA / / / |
(英) |
Voyce Synthesis / Pulse Density / Vocal Tract Shape Model / Utterance Process / FPGA / / / |
文献情報 |
信学技報, vol. 111, no. 483, NC2011-157, pp. 209-214, 2012年3月. |
資料番号 |
NC2011-157 |
発行日 |
2012-03-07 (NC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NC2011-157 |