研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
話者性を制御可能な音声合成のための話者埋め込み空間に関する実験的検討 ○森田湧大・齋藤大輔・峯松信明(東大) EA2023-93 SIP2023-140 SP2023-75 |
本論文では,弁別能力の異なる話者埋め込み抽出モデルを用いた,話者性の制御が可能な音声合成モデルの比較実験について報告する... [more] |
EA2023-93 SIP2023-140 SP2023-75 pp.190-195 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
VQ-VAEに基づく解釈可能なアクセント潜在変数を用いた多方言音声合成 ○山内一輝・齋藤佑樹・猿渡 洋(東大) EA2023-98 SIP2023-145 SP2023-80 |
本稿では,目的話者の母方言と同じ方言のテキスト音声合成(Text-to-Speech: TTS)を目的とする "Intr... [more] |
EA2023-98 SIP2023-145 SP2023-80 pp.220-225 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
x-vectorの話者空間を利用した2話者間の中間話者音声合成 ○細井颯太・木内貴浩・若林佑幸・北岡教英(豊橋技科大) EA2023-103 SIP2023-150 SP2023-85 |
近年,複数話者の声質や話し方について学習している音声合成器を用いて,学習セットに含まれていな い話者の音声を新たに合成す... [more] |
EA2023-103 SIP2023-150 SP2023-85 pp.250-255 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Transformerを用いた脳波信号からの音声復元の検討 ○水野友暁(電通大)・岸田拓也(愛知淑徳大)・吉村奈津江(東工大)・中鹿 亘(電通大) EA2023-108 SIP2023-155 SP2023-90 |
脳波信号から完全な音声を合成することは、困難な課題である。本稿では、脳波信号からの音声復元を、男女1人ずつ2名の声を聞い... [more] |
EA2023-108 SIP2023-155 SP2023-90 pp.277-282 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 16:35 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音源の放射特性を用いたバイノーラル合成における仮想音源の回転方向の弁別 ○西山織絵(千葉工大)・堀内俊治・大久保翔太(KDDI総合研)・苣木禎史(千葉工大) EA2023-125 SIP2023-172 SP2023-107 |
あたかもその場にいるような感覚をもたらすために,五感情報を取得,伝送,再生する臨場感通信の研究が進められている。しかし,... [more] |
EA2023-125 SIP2023-172 SP2023-107 pp.376-381 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 10:00 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Improvement of Tacotron2 text-to-speech model based on masking operation and positional attention mechanism ○Tong Ma・Daisuke Saito・Nobuaki Minematsu(Univ. of Tokyo) NLC2023-17 SP2023-37 |
[more] |
NLC2023-17 SP2023-37 pp.19-24 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 11:05 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]自己教師ありモデリに基づく感情豊かな音声合成のための感情転移と強度制御技術 ○李 巍・峯松信明・齋藤大輔(東大) NLC2023-21 SP2023-41 |
[more] |
NLC2023-21 SP2023-41 pp.43-48 |
PRMU, IPSJ-CVIM, IPSJ-DCC, IPSJ-CGVI (連催) |
2023-11-17 09:20 |
鳥取 |
鳥取県立生涯学習センター(県民ふれあい会館) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
変分自己符号化器を用いた発話時の動作生成の研究 ○賈 辰一・篠田浩一(東工大) PRMU2023-29 |
発話時の動作生成は, 発話音声に対応するジェスチャーを生成する研究である. 従来研究の手法は大きく分けて二つある.決定論... [more] |
PRMU2023-29 pp.74-79 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]MS-Harmonic-Net++ vs SiFi-GAN: 基本周波数制御可能な高速ニューラル波形生成モデルの比較 ○清水聡太(神戸大/NICT)・岡本拓磨(NICT)・高島遼一(神戸大)・大谷大和(NICT)・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-5 |
Harmonic-Net+はWORLD特徴量で動作する,基本周波数~(fo)および話速~(SR)制御可能な高速ニューラル... [more] |
SP2023-5 pp.20-25 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
全結合層型アップサンプリングを導入した高速ニューラル波形生成モデル ○山下陽生(神戸大/NICT)・岡本拓磨(NICT)・高島遼一(神戸大)・大谷大和(NICT)・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-15 |
近年,VITSやJETSといったモデルを用いることで高速かつ高品質なテキスト音声合成~(Text-toSpeech:~T... [more] |
SP2023-15 pp.73-78 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声長におけるポーズ長の割合が音声長によって知覚される主観的話速に及ぼす影響 ○玉川真帆・坂本修一(東北大) SP2023-23 |
主観的話速の知覚メカニズム解明を最終的な目的として,"音声全体に関わる要素"である「音声長」と「音声長におけるポーズ長の... [more] |
SP2023-23 pp.114-118 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
x-vectorと音声認識コーパスを用いた多様な発話スタイルに対応する複数話者テキスト音声合成の評価 ○日田光紀(和歌山大/NICT)・岡本拓磨(NICT)・西村竜一(和歌山大)・大谷大和(NICT)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-25 |
これまでに,合成時に対応できる話者数の増加を目的として,音声認識用コーパスであるCSJを用いて,また話者埋め込みとしてx... [more] |
SP2023-25 pp.125-130 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:10 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
基本周波数制御可能な高速ニューラル波形生成モデルの比較 ○清水聡太(神戸大/NICT)・岡本拓磨(NICT)・高島遼一・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) EA2022-75 SIP2022-119 SP2022-39 |
深層ニューラルネットワークを用いて音響特徴量から音声波形を生成するニューラルボコーダは,従来のソースフィルタボコーダに比... [more] |
EA2022-75 SIP2022-119 SP2022-39 pp.1-6 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:30 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
MS-FC-HiFiGAN : 学習可能な軽量アップサンプリングを用いた高速 ニューラル波形生成モデル ○山下陽生(神戸大/NICT)・岡本拓磨(NICT)・高島遼一・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) EA2022-76 SIP2022-120 SP2022-40 |
近年テキスト音声合成~(Text-to-Speech:~TTS)では品質を保ったまま推論速度を向上することが求められてお... [more] |
EA2022-76 SIP2022-120 SP2022-40 pp.7-12 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:50 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
real-time MRIで収録した調音運動に基づくend-to-end音声合成 ○大谷祐人・澤田 隼・大村英史・桂田浩一(東京理科大) EA2022-77 SIP2022-121 SP2022-41 |
real-time MRI (rtMRI)で収録した調音運動に基づいて音声を合成するend-to-end型の深層学習モデ... [more] |
EA2022-77 SIP2022-121 SP2022-41 pp.13-18 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 13:00 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[招待講演]マルチスポット再生 meets 多言語ニューラル音声合成 ~ 実装 is ホンマに all we need ~ ○岡本拓磨(NICT) EA2022-87 SIP2022-131 SP2022-51 |
多数のスピーカを用いて異なる場所に異なる音を別々に提示可能なマルチスポット再生技術を多言語音声合成技術と統合し,多言語音... [more] |
EA2022-87 SIP2022-131 SP2022-51 pp.73-76 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 11:00 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
日本語音声合成におけるアクセント句韻律特徴量の表現と予測 ○佐藤匡紀・高道慎之介・猿渡 洋(東大) EA2022-108 SIP2022-152 SP2022-72 |
音声合成を対話システムやオーディオブックにおける感情表現などさまざまな場面で利用するには,読み上げ口調だけではなく自然で... [more] |
EA2022-108 SIP2022-152 SP2022-72 pp.197-202 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 11:20 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声対話システムのための入力音声の感情に同調する声質変換とx-vector埋め込みを用いたテキストからの音声合成方式の検討 ○小原俊一・阿部匡伸・原 直(岡山大) EA2022-109 SIP2022-153 SP2022-73 |
本報告では,声質変換とx-vector埋め込みを用いて,入力音声と同じ感情を表現する音声合成方式を提案する.音声対話シス... [more] |
EA2022-109 SIP2022-153 SP2022-73 pp.203-208 |
EA, US (併催) |
2022-12-22 13:30 |
広島 |
サテライトキャンパスひろしま |
[ポスター講演]汎用ボコーダにおける話者ベクトルを多入力に用いた子供音声の品質改善 ○吉田 悟・古家賢一(大分大)・水野秀之(諏訪理科大) EA2022-64 |
音声合成で用いられているニューラルボコーダは人間の音声と区別がつかない程, 高品質な音声を合成することが可能である. 本... [more] |
EA2022-64 pp.18-23 |
NLC, SP (共催) IPSJ-NL, IPSJ-SLP (共催) (連催) [詳細] |
2022-11-30 15:30 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声合成と音声認識に対するテキストデータを用いた半教師あり統合学習 ○牧島直輝・鈴木聡志・安藤厚志・増村 亮(NTT) NLC2022-14 SP2022-34 |
本稿では,音声合成と音声認識をテキストと音声の少規模ペアデータ及び大規模なテキストデータで学習する新しい学習手法を提案す... [more] |
NLC2022-14 SP2022-34 pp.27-32 |