研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
話者性を制御可能な音声合成のための話者埋め込み空間に関する実験的検討 ○森田湧大・齋藤大輔・峯松信明(東大) EA2023-93 SIP2023-140 SP2023-75 |
本論文では,弁別能力の異なる話者埋め込み抽出モデルを用いた,話者性の制御が可能な音声合成モデルの比較実験について報告する... [more] |
EA2023-93 SIP2023-140 SP2023-75 pp.190-195 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
VQ-VAEに基づく解釈可能なアクセント潜在変数を用いた多方言音声合成 ○山内一輝・齋藤佑樹・猿渡 洋(東大) EA2023-98 SIP2023-145 SP2023-80 |
本稿では,目的話者の母方言と同じ方言のテキスト音声合成(Text-to-Speech: TTS)を目的とする "Intr... [more] |
EA2023-98 SIP2023-145 SP2023-80 pp.220-225 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
x-vectorの話者空間を利用した2話者間の中間話者音声合成 ○細井颯太・木内貴浩・若林佑幸・北岡教英(豊橋技科大) EA2023-103 SIP2023-150 SP2023-85 |
近年,複数話者の声質や話し方について学習している音声合成器を用いて,学習セットに含まれていな い話者の音声を新たに合成す... [more] |
EA2023-103 SIP2023-150 SP2023-85 pp.250-255 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Transformerを用いた脳波信号からの音声復元の検討 ○水野友暁(電通大)・岸田拓也(愛知淑徳大)・吉村奈津江(東工大)・中鹿 亘(電通大) EA2023-108 SIP2023-155 SP2023-90 |
脳波信号から完全な音声を合成することは、困難な課題である。本稿では、脳波信号からの音声復元を、男女1人ずつ2名の声を聞い... [more] |
EA2023-108 SIP2023-155 SP2023-90 pp.277-282 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]MS-Harmonic-Net++ vs SiFi-GAN: 基本周波数制御可能な高速ニューラル波形生成モデルの比較 ○清水聡太(神戸大/NICT)・岡本拓磨(NICT)・高島遼一(神戸大)・大谷大和(NICT)・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-5 |
Harmonic-Net+はWORLD特徴量で動作する,基本周波数~(fo)および話速~(SR)制御可能な高速ニューラル... [more] |
SP2023-5 pp.20-25 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]Diff-SVCを用いたオペラ歌唱音声合成 ○菅原碧斗(神戸大)・岸本宗真・足立優司・田井清登(メック)・高島遼一・滝口哲也(神戸大) SP2023-7 |
歌声合成技術は娯楽分野において広く普及し,故人や声を失った患者の歌声を再現する手法として注目を集めている.
また,近年... [more] |
SP2023-7 pp.30-35 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
全結合層型アップサンプリングを導入した高速ニューラル波形生成モデル ○山下陽生(神戸大/NICT)・岡本拓磨(NICT)・高島遼一(神戸大)・大谷大和(NICT)・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-15 |
近年,VITSやJETSといったモデルを用いることで高速かつ高品質なテキスト音声合成~(Text-toSpeech:~T... [more] |
SP2023-15 pp.73-78 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声長におけるポーズ長の割合が音声長によって知覚される主観的話速に及ぼす影響 ○玉川真帆・坂本修一(東北大) SP2023-23 |
主観的話速の知覚メカニズム解明を最終的な目的として,"音声全体に関わる要素"である「音声長」と「音声長におけるポーズ長の... [more] |
SP2023-23 pp.114-118 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
x-vectorと音声認識コーパスを用いた多様な発話スタイルに対応する複数話者テキスト音声合成の評価 ○日田光紀(和歌山大/NICT)・岡本拓磨(NICT)・西村竜一(和歌山大)・大谷大和(NICT)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-25 |
これまでに,合成時に対応できる話者数の増加を目的として,音声認識用コーパスであるCSJを用いて,また話者埋め込みとしてx... [more] |
SP2023-25 pp.125-130 |
PRMU, IBISML (共催) IPSJ-CVIM (連催) [詳細] |
2023-03-02 15:10 |
北海道 |
はこだて未来大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[招待講演]音を作るための拡散確率モデル ○小泉悠馬(Google Research) PRMU2022-87 IBISML2022-94 |
音響信号を扱う機械学習のタスクは,「音を認識する」タスクと「音を作る」タスクに大別できる. 特に後者の音を作るタスク,例... [more] |
PRMU2022-87 IBISML2022-94 p.149 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:10 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
基本周波数制御可能な高速ニューラル波形生成モデルの比較 ○清水聡太(神戸大/NICT)・岡本拓磨(NICT)・高島遼一・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) EA2022-75 SIP2022-119 SP2022-39 |
深層ニューラルネットワークを用いて音響特徴量から音声波形を生成するニューラルボコーダは,従来のソースフィルタボコーダに比... [more] |
EA2022-75 SIP2022-119 SP2022-39 pp.1-6 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:30 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
MS-FC-HiFiGAN : 学習可能な軽量アップサンプリングを用いた高速 ニューラル波形生成モデル ○山下陽生(神戸大/NICT)・岡本拓磨(NICT)・高島遼一・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) EA2022-76 SIP2022-120 SP2022-40 |
近年テキスト音声合成~(Text-to-Speech:~TTS)では品質を保ったまま推論速度を向上することが求められてお... [more] |
EA2022-76 SIP2022-120 SP2022-40 pp.7-12 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:50 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
real-time MRIで収録した調音運動に基づくend-to-end音声合成 ○大谷祐人・澤田 隼・大村英史・桂田浩一(東京理科大) EA2022-77 SIP2022-121 SP2022-41 |
real-time MRI (rtMRI)で収録した調音運動に基づいて音声を合成するend-to-end型の深層学習モデ... [more] |
EA2022-77 SIP2022-121 SP2022-41 pp.13-18 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 13:00 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[招待講演]マルチスポット再生 meets 多言語ニューラル音声合成 ~ 実装 is ホンマに all we need ~ ○岡本拓磨(NICT) EA2022-87 SIP2022-131 SP2022-51 |
多数のスピーカを用いて異なる場所に異なる音を別々に提示可能なマルチスポット再生技術を多言語音声合成技術と統合し,多言語音... [more] |
EA2022-87 SIP2022-131 SP2022-51 pp.73-76 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 15:10 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
学習済みニューラルボコーダによる頭蓋内脳波(ECoG)からの音声再合成 ○重見 開・古明地秀治(東京農工大)・三橋 匠・飯村康司・鈴木皓晴・菅野秀宣(順天堂大)・篠田浩一(東工大)・矢田部浩平・田中聡久(東京農工大) |
頭蓋内に留置した電極で計測した脳波から,発声,傾聴,想像時の音声を推定する技術の構築は未だ挑戦的な課題である.本発表では... [more] |
|
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 11:00 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
日本語音声合成におけるアクセント句韻律特徴量の表現と予測 ○佐藤匡紀・高道慎之介・猿渡 洋(東大) EA2022-108 SIP2022-152 SP2022-72 |
音声合成を対話システムやオーディオブックにおける感情表現などさまざまな場面で利用するには,読み上げ口調だけではなく自然で... [more] |
EA2022-108 SIP2022-152 SP2022-72 pp.197-202 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 11:20 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声対話システムのための入力音声の感情に同調する声質変換とx-vector埋め込みを用いたテキストからの音声合成方式の検討 ○小原俊一・阿部匡伸・原 直(岡山大) EA2022-109 SIP2022-153 SP2022-73 |
本報告では,声質変換とx-vector埋め込みを用いて,入力音声と同じ感情を表現する音声合成方式を提案する.音声対話シス... [more] |
EA2022-109 SIP2022-153 SP2022-73 pp.203-208 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 14:50 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
多ドメイン共感的対話音声合成に向けた音声コーパスの構築 ○齋藤佑樹・飯森栄治・高道慎之介(東大)・橘 健太郎(LINE)・猿渡 洋(東大) |
本研究では,人間のように多数のドメインで対話相手と共感的に会話できる人工知能エージェントを実現するためのコーパスを構築し... [more] |
|
EA, US (併催) |
2022-12-22 13:30 |
広島 |
サテライトキャンパスひろしま |
[ポスター講演]汎用ボコーダにおける話者ベクトルを多入力に用いた子供音声の品質改善 ○吉田 悟・古家賢一(大分大)・水野秀之(諏訪理科大) EA2022-64 |
音声合成で用いられているニューラルボコーダは人間の音声と区別がつかない程, 高品質な音声を合成することが可能である. 本... [more] |
EA2022-64 pp.18-23 |
NLC, SP (共催) IPSJ-NL, IPSJ-SLP (共催) (連催) [詳細] |
2022-11-30 15:30 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声合成と音声認識に対するテキストデータを用いた半教師あり統合学習 ○牧島直輝・鈴木聡志・安藤厚志・増村 亮(NTT) NLC2022-14 SP2022-34 |
本稿では,音声合成と音声認識をテキストと音声の少規模ペアデータ及び大規模なテキストデータで学習する新しい学習手法を提案す... [more] |
NLC2022-14 SP2022-34 pp.27-32 |