トピックス
[共催]拡散確率モデルと音声波形生成
2022.06.14拡散確率モデルと音声波形生成
Googleリサーチの小泉さんをお招きして、下記講演会を開催します。興味のある方は是非ご参加ください。
■日 時:2022年7月6日(水) 13:00~14:20
■会 場:琉球大学情報基盤統括センター(旧総合情報処理センター)2階第3実習室
オンライン(Microsoft TEAMS)
■聴講料:無料
Google Research 小泉悠馬 氏
拡散確率モデルと音声波形生成
近年、拡散確率モデルを利用した画像生成や音声波形生成が注目を集めている。SNS などでは “徐々に雑音を除去し高精細な画像や音声を生成する手法” などと、さも簡単な手法であるかのように説明されることが多い。しかし、実際の論文 [1] では確率モデルや変分推論などの高度な数式を駆使しており、諦めてそっとブラウザを閉じてしまう方もいるだろう。なお、講演者もその一人であった。
そこで本講演では、拡散確率モデルをボトムアップに説明する。具体的には、アルゴリズムの直感的な説明を行い、その後、アルゴリズムが論文のどの数式と結びついているのかを必要最低限の範囲で説明する。
最後に、講演者らの最近の研究である、SpecGrad [2] と呼ばれる拡散確率モデルを利用した音声波形生成法を説明する。
[1] J. Ho, et al., “Denoising Diffusion Probabilistic Models,” NeurIPS 2020.
[2] Y. Koizumi, et al., “SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with Adaptive Noise Spectral Shaping,” arXiv:2203.16749, 2022.
[現地参加]当日会場まで直接お越し下さい。
※当日は入口に設置されたカメラで検温し、手指消毒、マスク着用をお願いいたします。
[オンライン]
当日下記オンライン参加をクリックし入室許可をお持ちください。
■主催:琉球大学情報基盤統括センター 舟木研究室
■共催:(一社)電子情報通信学会九州支部
琉球大学情報基盤統括センター 舟木慶一
funaki@cc.u-ryukyu.ac.jp