研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 16:45 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
複数のラグ窓対を用いた音声基本周波数と周期性尺度の推定 ○越森道貴(電通大)・嵯峨山茂樹(東大/電通大)・中鹿 亘(電通大) EA2023-75 SIP2023-122 SP2023-57 |
LPCにおける変形相関法の原理を拡張し、短時間音声信号スペクトルから基本周波数と周期性尺度を推定するための手法としてラグ... [more] |
EA2023-75 SIP2023-122 SP2023-57 pp.85-90 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
潜在変数と観測データにガンマ分布を仮定したVAEによる音声振幅スペクトル表現 ○今市夏菜子・中鹿 亘(電通大) EA2023-104 SIP2023-151 SP2023-86 |
近年,データの生成において複雑な関係を表現できる深層生成モデルが注目されており,その例として変分オートエンコーダ(Var... [more] |
EA2023-104 SIP2023-151 SP2023-86 pp.256-261 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Transformerを用いた脳波信号からの音声復元の検討 ○水野友暁(電通大)・岸田拓也(愛知淑徳大)・吉村奈津江(東工大)・中鹿 亘(電通大) EA2023-108 SIP2023-155 SP2023-90 |
脳波信号から完全な音声を合成することは、困難な課題である。本稿では、脳波信号からの音声復元を、男女1人ずつ2名の声を聞い... [more] |
EA2023-108 SIP2023-155 SP2023-90 pp.277-282 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
FaderNetを用いた未知話者に対する音声印象変換 ○釘本 咲・中鹿 亘(電通大) SP2023-2 |
本稿では声質変換手法の1つであるFaderNetVCを用いて話者性はそのままに音声の印象のみを変えるという先行研究をもと... [more] |
SP2023-2 pp.4-7 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ショートペーパー]SBERT-based Musical Components Estimation from Lyrics Trained with Imbalanced "Orpheus" Data ○Mastuti Puspitasari・Takuya Takahashi(UEC)・Gen Hori(AU)・Shigeki Sagayama・Toru Nakashika(UEC) SP2023-18 |
[more] |
SP2023-18 pp.86-90 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音楽分析・生成のための非和声音データベースの構築 ○髙橋拓椰・金子仁美・中鹿 亘・嵯峨山茂樹(電通大) SP2023-20 |
非和声音は、和声理論を構成する要素の一つであり、音楽の分析や作曲において重要な役割を果たす。しかし、非和声音ラベルが注釈... [more] |
SP2023-20 pp.97-102 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 10:40 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
入力特徴量で条件づけた拡散確率モデルによるパラレル声質変換 ○岸田拓也・中鹿 亘(電通大) EA2022-107 SIP2022-151 SP2022-71 |
本研究では,変換目標と変換元の音声の発話内容を揃えたパラレルデータセットで学習した拡散確率モデルをベースとする声質変換手... [more] |
EA2022-107 SIP2022-151 SP2022-71 pp.191-196 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2022-06-17 15:00 |
ONLINE |
オンライン開催 |
制限ボルツマンマシンを用いた独立低ランク行列分析に基づくブラインド音源分離 ○古田翔太郎・岸田拓也・中鹿 亘(電通大) SP2022-8 |
音源分離とは,複数の音が混合した音源を個々の音に分ける技術であり,様々な分野での活用が期待されている.近年では,ブライン... [more] |
SP2022-8 pp.26-29 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2022-06-18 15:00 |
ONLINE |
オンライン開催 |
F0適応ラグ窓を用いた音声分析系の精緻化 ○越森道貴・嵯峨山茂樹・岸田拓也・中鹿 亘(電通大) SP2022-21 |
音声分析の手法として様々なものが研究されているが、その一つにラグ窓法というものがある。これはソース・フィルタモデルに基づ... [more] |
SP2022-21 pp.90-93 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2022-06-18 15:00 |
ONLINE |
オンライン開催 |
LSP周波数間隔のクロスエントロピー誤差最小化に基づくVAE声質変換 ○平本佳弘・嵯峨山茂樹・岸田拓也・中鹿 亘(電通大) SP2022-23 |
[more] |
SP2022-23 pp.100-103 |
SP, IPSJ-SLP, IPSJ-MUS (連催) |
2021-06-19 15:00 |
ONLINE |
オンライン開催 |
話者特徴抽出器を加えたFaderNetVCによる未知話者声質変換 ○井硲 巧・岸田拓也・中鹿 亘(電通大) SP2021-20 |
近年,Deep Neural Network(以下,DNNとする)を用いた声質変換モデルが数多く提案されており,その... [more] |
SP2021-20 pp.91-96 |
SP, SIP, EA (共催) |
2017-03-02 13:10 |
沖縄 |
沖縄産業支援センター |
構音障害者音声認識のための適応型restricted Boltzmann machineを用いた特徴量抽出 ○高島悠樹(神戸大)・中鹿 亘(電通大)・滝口哲也・有木康雄(神戸大) EA2016-140 SIP2016-195 SP2016-135 |
[more] |
EA2016-140 SIP2016-195 SP2016-135 pp.321-326 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP (連催) (併催) [詳細] |
2015-12-02 10:25 |
愛知 |
名古屋工業大学 |
制約付きThree-Way Restricted Boltzmann Machineを用いた音響・音韻・話者情報の同時モデリング ○中鹿 亘(電通大)・滝口哲也(神戸大) SP2015-71 |
本研究では,音響特徴量・音韻特徴量・話者特徴量の3つを変数とするThree-Way Restricted Boltzma... [more] |
SP2015-71 pp.7-12 |
WIT, SP, ASJ-H, PRMU (共催) |
2015-06-18 15:15 |
新潟 |
新潟大学駅南キャンパス「ときめいと」 |
構音障害者音声認識のための混合正規分布に基づく音素ラベリングの検討 ○高島悠樹(神戸大)・中鹿 亘(電通大)・滝口哲也・有木康雄(神戸大) PRMU2015-44 SP2015-13 WIT2015-13 |
本報告では,アテトーゼ型脳性麻痺による構音障害者の音声認識の検討を行う.従来研究として,畳み込みニューラルネットワークを... [more] |
PRMU2015-44 SP2015-13 WIT2015-13 pp.71-76 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 13:30 |
神奈川 |
東工大(すずかけ台) |
[ポスター講演]話者適応型Restricted Boltzmann Machineを用いた声質変換の検討 ○中鹿 亘・滝口哲也・有木康雄(神戸大) SP2014-126 |
(事前公開アブストラクト) 近年,非線形変換関数に基づく声質変換法として,Restricted Boltzmann Ma... [more] |
SP2014-126 pp.165-170 |
SP, IPSJ-MUS (連催) |
2014-05-25 11:30 |
東京 |
日本大学文理学部キャンパス 百周年記念館 |
[一般発表]スパース表現に基づく声質変換のための結合型restricted Boltzmann machine ○中鹿 亘・滝口哲也・有木康雄(神戸大) SP2014-34 |
近年,声質変換の研究分野において,over-fitting や over-smoothing の生じにくいスパース表現に... [more] |
SP2014-34 pp.343-348 |
SP, IPSJ-SLP (連催) |
2013-12-19 17:15 |
東京 |
筑波大学文京キャンパス |
話者依存型Conditional Restricted Boltzmann Machineによる声質変換 ○中鹿 亘・滝口哲也・有木康雄(神戸大) SP2013-88 |
本研究では,元の音響特徴量空間よりも音韻性や時間変化性を抑え,話者性を強調させることによって,より入力話者音声の声質を出... [more] |
SP2013-88 pp.83-88 |
SP |
2011-07-23 09:55 |
北海道 |
定山渓グランドホテル瑞苑 |
確率スペクトル包絡を用いた混合音解析における制約付きスペクトル生成法の検討 ○中鹿 亘・滝口哲也・有木康雄(神戸大) SP2011-50 |
従来の代表的な信号解析手法の中に,NMF(非負値行列因子分解)を用いたものがある。特に,事例ベースのNMFが音源分離や信... [more] |
SP2011-50 pp.51-56 |
NLC, SP (共催) (連催) [詳細] |
2010-12-21 16:40 |
東京 |
国立オリンピック記念青少年総合センター |
基底の反復生成と教師ありNMFを用いた信号解析 ○中鹿 亘・滝口哲也・有木康雄(神戸大) NLC2010-29 SP2010-102 |
従来の代表的な信号解析手法の中に,NMF(非負値行列因子分解)を用いたものがある.
中でも,取り除きたい大量のサンプル... [more] |
NLC2010-29 SP2010-102 pp.195-200 |
SP, NLC (共催) |
2009-12-22 15:50 |
東京 |
東京大学・山上会館 |
多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討 ○中鹿 亘(神戸大)・立花隆輝・西村雅史(日本IBM)・滝口哲也・有木康雄(神戸大) NLC2009-26 SP2009-90 |
これまでに数多くの音声合成技術が提案されているが,我々は,音素信号の調波時間スペクトル形状をモ
デル関数で近似し,音声... [more] |
NLC2009-26 SP2009-90 pp.165-170 |