研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
NC, MBE (併催) |
2024-03-11 16:50 |
東京 |
東京大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
条件付きVAEによる印象情報を反映した音色合成手法 ~ 継時変化情報の応用 ~ ○吉川美佑・黒柳 奨(名工大) NC2023-49 |
音色と人間が抱く印象の関係性を体系立てて説明することは難しく,音色のデザインにおいては経験や感覚に大きく依存している側面... [more] |
NC2023-49 pp.37-42 |
PRMU, IPSJ-CVIM, IPSJ-DCC, IPSJ-CGVI (連催) |
2023-11-17 09:20 |
鳥取 |
鳥取県立生涯学習センター(県民ふれあい会館) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
変分自己符号化器を用いた発話時の動作生成の研究 ○賈 辰一・篠田浩一(東工大) PRMU2023-29 |
発話時の動作生成は, 発話音声に対応するジェスチャーを生成する研究である. 従来研究の手法は大きく分けて二つある.決定論... [more] |
PRMU2023-29 pp.74-79 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]MS-Harmonic-Net++ vs SiFi-GAN: 基本周波数制御可能な高速ニューラル波形生成モデルの比較 ○清水聡太(神戸大/NICT)・岡本拓磨(NICT)・高島遼一(神戸大)・大谷大和(NICT)・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-5 |
Harmonic-Net+はWORLD特徴量で動作する,基本周波数~(fo)および話速~(SR)制御可能な高速ニューラル... [more] |
SP2023-5 pp.20-25 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
全結合層型アップサンプリングを導入した高速ニューラル波形生成モデル ○山下陽生(神戸大/NICT)・岡本拓磨(NICT)・高島遼一(神戸大)・大谷大和(NICT)・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-15 |
近年,VITSやJETSといったモデルを用いることで高速かつ高品質なテキスト音声合成~(Text-toSpeech:~T... [more] |
SP2023-15 pp.73-78 |
NC, MBE (併催) |
2023-03-14 15:25 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
条件付きVAEによる印象情報を反映した音色合成手法 ~ 印象による条件付けと音波形の生成 ~ ○渡邉 健・黒柳 奨(名工大) NC2022-106 |
音色と人間が抱く印象の関係性を体系立てて説明することは難しく,音色のデザインにおいては経験や感 覚に大きく依存している側... [more] |
NC2022-106 pp.84-89 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:10 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
基本周波数制御可能な高速ニューラル波形生成モデルの比較 ○清水聡太(神戸大/NICT)・岡本拓磨(NICT)・高島遼一・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) EA2022-75 SIP2022-119 SP2022-39 |
深層ニューラルネットワークを用いて音響特徴量から音声波形を生成するニューラルボコーダは,従来のソースフィルタボコーダに比... [more] |
EA2022-75 SIP2022-119 SP2022-39 pp.1-6 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:30 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
MS-FC-HiFiGAN : 学習可能な軽量アップサンプリングを用いた高速 ニューラル波形生成モデル ○山下陽生(神戸大/NICT)・岡本拓磨(NICT)・高島遼一・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) EA2022-76 SIP2022-120 SP2022-40 |
近年テキスト音声合成~(Text-to-Speech:~TTS)では品質を保ったまま推論速度を向上することが求められてお... [more] |
EA2022-76 SIP2022-120 SP2022-40 pp.7-12 |
EA, US (併催) |
2022-12-22 13:30 |
広島 |
サテライトキャンパスひろしま |
[ポスター講演]汎用ボコーダにおける話者ベクトルを多入力に用いた子供音声の品質改善 ○吉田 悟・古家賢一(大分大)・水野秀之(諏訪理科大) EA2022-64 |
音声合成で用いられているニューラルボコーダは人間の音声と区別がつかない程, 高品質な音声を合成することが可能である. 本... [more] |
EA2022-64 pp.18-23 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2022-06-18 10:50 |
ONLINE |
オンライン開催 |
[招待講演]Crazy vocoderは砕けない ~ でもちょっとくだけた未来の話を ~ ○森勢将雅(明大) SP2022-15 |
現在の音声合成研究者が論文にVocoderと記載するとき,その多くはDeep neural network (DNN)を... [more] |
SP2022-15 pp.61-66 |
WIT, IPSJ-AAC (連催) |
2022-03-08 10:55 |
ONLINE |
オンライン開催 |
健常音声からの声質変換と多数話者ボコーダによる構音障害話者の明瞭な音声合成の検討 ○高野哲朗(ヒューマンテクノシステム)・能勢 隆・金垣 葵(東北大)・渡辺 聡(ヒューマンテクノシステム) WIT2021-46 |
健常話者の音声から構音障害話者の音声へと声質変換することにより,障害話者の声色を維持しつつ聞き取りやすい合成音声を生成す... [more] |
WIT2021-46 pp.18-23 |
EA, US (併催) |
2021-12-22 13:30 |
熊本 |
崇城大学 メインキャンパス SoLA2階 (熊本県熊本市西区池田4-22-1) |
[ポスター講演]WaveNetボコーダにおける複数話者学習時の音声品質の向上 ○吉田 悟・上ノ原進吾・古家賢一(大分大) EA2021-57 |
近年, ニューラルネットワークを用いた音声合成や声質変換技術が注目を集めており, 自然性の高い音声を合成することが可能で... [more] |
EA2021-57 pp.1-6 |
EA, SP, SIP (共催) US, IPSJ-SLP (連催) (連催) ※学会内は併催 [詳細] |
2021-03-03 14:05 |
ONLINE |
オンライン開催 |
[ポスター講演]統合型ソースフィルタネットワークによるニューラルボコーダ ○米山怜於・呉 宜樵・戸田智基(名大) EA2020-69 SIP2020-100 SP2020-34 |
本稿では,ソースフィルタ理論に基づくニューラルボコーダを単一のネットワークにより実現する手法を提案する.深層学習に基づく... [more] |
EA2020-69 SIP2020-100 SP2020-34 pp.57-62 |
WIT, SP (共催) IPSJ-SLP (連催) [詳細] |
2020-10-22 13:00 |
ONLINE |
オンライン開催 |
[招待講演]日本語End-to-End 音声合成に対するNHKの取り組み ○栗原 清(NHK) SP2020-11 WIT2020-12 |
放送事業者であるNHKは,番組を制作し,それを放送することを主な業務としている.毎日,多くの番組を制作する中で,音声コン... [more] |
SP2020-11 WIT2020-12 pp.19-20 |
RECONF |
2020-05-28 15:15 |
ONLINE |
オンライン開催 |
ベイジアンネットワーク構造学習の演算回路の繰り返し利用によるFPGAアクセラレータ 新田泰大(京大)・○高瀬英希(京大/JST) RECONF2020-7 |
ベイジアンネットワークは,複数の観測された現象の因果関係あるいは相関関係を表すグラフィカルモデルの1つである.この構造学... [more] |
RECONF2020-7 pp.37-42 |
PRMU, IPSJ-CVIM (連催) |
2020-03-16 11:15 |
京都 |
京都大学 (開催中止,技報発行あり) |
ラーメンスタイルエンコーダーを用いたスタイル特徴とマスク画像からの画像生成 ○趙 宰亨・下田 和・柳井啓司(電通大) PRMU2019-71 |
近年、Web上のブログやTwitter とInstagramのようなソーシャルネットワークサービス(SNS)などに大量の... [more] |
PRMU2019-71 pp.33-38 |
SP, EA, SIP (共催) |
2020-03-02 09:20 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
複数話者WaveNetボコーダを用いたニューラル話速変換の試み ○岡本拓磨(NICT)・松原圭亮(神戸大/NICT)・戸田智基(名大/NICT)・志賀芳則・河井 恒(NICT) EA2019-101 SIP2019-103 SP2019-50 |
音の高さを変えずに音声を伸縮する話速変換技術は,従来 WSOLA や STRIGHT ボコーダ等の信号処理 により実現さ... [more] |
EA2019-101 SIP2019-103 SP2019-50 pp.1-6 |
AI |
2020-02-14 14:40 |
島根 |
島根大学 出雲キャンパス |
データの分析と合成を巡るクワイン哲学 ~ 現代の観点から「経験主義の2つのドグマ」を再考 ~ ○小池 誠(小池誠マイクロ波研) AI2019-47 |
クワインの名作「経験主義の2つのドグマ」は経験主義,分析哲学のような形而上学に関するが,その実体は自然言語及び人工言語を... [more] |
AI2019-47 pp.23-31 |
SP |
2020-01-29 11:30 |
富山 |
高岡市生涯学習センター |
話者コードを用いた多話者音声合成における深層ガウス過程の利用 ○三井健太郎・郡山知樹・猿渡 洋(東大) SP2019-49 |
単一のモデルで多数の話者をモデリングする多話者音声合成の手法として,話者コードと呼ばれるベクトルを用いた条件付けが広く用... [more] |
SP2019-49 pp.31-36 |
IT, SIP, RCS (共催) |
2020-01-24 09:30 |
広島 |
広島市青少年センター |
ハイブリッドMIMOシステムにおける複数アンテナサブセット選択による信号合成を利用したプリコーダ設計の検討 ○玉手大智・眞田幸俊(慶大) IT2019-60 SIP2019-73 RCS2019-290 |
本稿では,ハイブリッドMIMO(Multiple-Input Multiple-Output) システムにおいて,アンテ... [more] |
IT2019-60 SIP2019-73 RCS2019-290 pp.135-141 |
IPSJ-SLDM, IPSJ-ARC (共催) RECONF, VLD, CPSY (共催) (連催) [詳細] |
2020-01-23 11:50 |
神奈川 |
慶応義塾大学 日吉キャンパス 来往舎 |
RISC-V機械語プログラムからのバイナリ合成 ○浜名将輝・石浦菜岐佐(関西学院大) VLD2019-71 CPSY2019-69 RECONF2019-61 |
本稿では, RISC-V 機械語プログラムからハードウェアを自動合成する手法を提案する. RISC-V を用いた CPU... [more] |
VLD2019-71 CPSY2019-69 RECONF2019-61 pp.111-115 |