研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
SIS |
2024-03-14 13:00 |
神奈川 |
神奈川工科大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
閾値を考慮した雑音下での信号の時間位置検出について ~ フラクタル次元フィルタの応用 ~ 柴山秀雄(芝浦工大)・○眞壁義明(神奈川工科大)・武藤憲司(芝浦工大)・木村誠聡(神奈川工科大) SIS2023-45 |
近隣騒音による紛争は,音圧レベルが低くても起こりうる. このような場合,目的音の音圧レベルは背景騒音よりも低いことが多い... [more] |
SIS2023-45 pp.1-6 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Remixed2Remixedを用いた音声強調のモデル学習法の改善 ○李 莉・関 翔悟(サイバーエージェント) EA2023-95 SIP2023-142 SP2023-77 |
深層学習を用いた音声強調において,ノイジー音声とクリーン音声のペアを学習データとする教師あり学習モデルは,学習データと異... [more] |
EA2023-95 SIP2023-142 SP2023-77 pp.202-207 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 16:35 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
車内環境における音声認識のための多チャンネルブラインド音源分離の性能評価 ○竹内柚月・植野夏樹・小野順貴(都立大)・高沢剛史・島ノ江修平・種村友貴(ミライズテクノロジーズ) EA2023-127 SIP2023-174 SP2023-109 |
車内環境では,様々な種類の雑音が重畳するため音声認識が困難となる.これに対し,多チャンネルマイクを利用できる場合には,ビ... [more] |
EA2023-127 SIP2023-174 SP2023-109 pp.388-393 |
SIS |
2023-12-08 09:50 |
愛知 |
名古屋市立大学桜山キャンパス (ハイブリッド開催,主:現地開催,副:オンライン開催) |
フラクタル次元フィルタを用いた背景雑音下での信号の時間位置検出について 柴山秀雄(芝浦工大)・○眞壁義明(神奈川工科大)・武藤憲司(芝浦工大)・木村誠聡(神奈川工科大) SIS2023-34 |
環境基準で定めた騒音レベルより低い場合でも,近隣騒音による紛争は発生している. 背景雑音のレベルが高い条件下で,原因の対... [more] |
SIS2023-34 pp.55-60 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 09:30 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Enhancing Recognition of Rare Words in ASR through Error Detection and Context-Aware Error Correction ○Jiajun He・Zekun Yang・Tomoki Toda(名大) NLC2023-16 SP2023-36 |
Automatic speech recognition (ASR) systems often suffer from... [more] |
NLC2023-16 SP2023-36 pp.13-18 |
WIT, SP (共催) IPSJ-SLP (連催) [詳細] |
2023-10-14 16:40 |
福岡 |
九州工業大学(戸畑キャンパス) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Sequence-to-sequence Voice Conversion for Electrolaryngeal Speech Enhancement with Multi-stage Pretraining and Fine-tuning Techniques ○Ding Ma・Lester Phillip Violeta・Kazuhiro Kobayashi・Tomoki Toda(Nagoya Univ.) SP2023-32 WIT2023-23 |
Sequence-to-sequence (seq2seq) voice conversion (VC) models ... [more] |
SP2023-32 WIT2023-23 pp.27-32 |
WIT, SP (共催) IPSJ-SLP (連催) [詳細] |
2023-10-14 17:05 |
福岡 |
九州工業大学(戸畑キャンパス) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Electrolaryngeal Speech Enhancement through Strong Linguistic Encoding Methods ○Lester Phillip Violeta・Wen-Chin Huang・Ding Ma・Ryuichi Yamamoto・Kazuhiro Kobayashi・Tomoki Toda(Nagoya Univ.) SP2023-33 WIT2023-24 |
Although pretraining and fine-tuning approaches have proven ... [more] |
SP2023-33 WIT2023-24 pp.33-38 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
暗黙的言語情報を置換するCTCデコーダを用いた ストリーミング音声認識 ○高城巽成(豊橋技科大)・小川厚徳(NTT)・北岡教英・若林佑幸(豊橋技科大) SP2023-12 |
音声認識技術は, 音声認識モデルの精度向上により, さまざまな分野で利用されているが, 学習に用いるデータと認識対象とな... [more] |
SP2023-12 pp.60-64 |
PRMU, IBISML (共催) IPSJ-CVIM (連催) [詳細] |
2023-03-02 15:10 |
北海道 |
はこだて未来大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[招待講演]音を作るための拡散確率モデル ○小泉悠馬(Google Research) PRMU2022-87 IBISML2022-94 |
音響信号を扱う機械学習のタスクは,「音を認識する」タスクと「音を作る」タスクに大別できる. 特に後者の音を作るタスク,例... [more] |
PRMU2022-87 IBISML2022-94 p.149 |
SIS |
2023-03-03 11:10 |
千葉 |
千葉工業大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声強調性能改善に向けたデータ拡張手法導入の検討 ○春日玲人・杉浦陽介・安井希子・島村徹也(埼玉大) SIS2022-52 |
音声強調の分野は世界中で幅広く研究が行われており,多くの音声強調手法が提案されている.一方で,高性能な音声強調ネットワー... [more] |
SIS2022-52 pp.64-69 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 11:00 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
DNN音声強調におけるNoisy-target Trainingの分析と実応用に向けた調査 ○藤村拓弥・戸田智基(名大) EA2022-112 SIP2022-156 SP2022-76 |
Deep neural network (DNN)音声強調では,一般的にクリーン音声を学習のターゲットとして用いる.しか... [more] |
EA2022-112 SIP2022-156 SP2022-76 pp.221-226 |
SIS, ITE-BCT (連催) |
2022-10-13 14:15 |
青森 |
八戸工業大学(1号館2階201室「多目的ホール」) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声自然性改善に向けた音声強調ネットワークに対するカプセル構造の導入 ○春日玲人・島村徹也・杉浦陽介・安井希子(埼玉大) SIS2022-12 |
音声強調の分野は世界中で幅広く研究が行われているが,音声信号処理で扱われる基本的な量の中で,振幅や周波数などに比べ,位相... [more] |
SIS2022-12 pp.7-12 |
SIP |
2022-08-26 14:08 |
沖縄 |
大濱信泉記念館(石垣島) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Study on Bone-conducted Speech Enhancement Using Vector-quantized Variational Autoencoder and Gammachirp Filterbank Cepstral Coefficients ○Quoc-Huy Nguyen・Masashi Unoki(JAIST) SIP2022-71 |
[more] |
SIP2022-71 pp.109-114 |
EA, SIP, SP (共催) IPSJ-SLP (連催) [詳細] |
2022-03-01 13:10 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
IRMを用いた音声強調処理の主観了解度の上限評価 ~ 防音室実験とクラウドソーシング実験の対比 ~ ○山本絢子・入野俊夫(和歌山大)・荒木章子・新井賢一・小川厚徳・木下慶介・中谷智広(NTT) EA2021-74 SIP2021-101 SP2021-59 |
音声強調処理の客観評価指標を開発することを目的として、音声了解度の主観評価実験を防音室とクラウドソーシングで行った。ここ... [more] |
EA2021-74 SIP2021-101 SP2021-59 pp.64-69 |
SP, IPSJ-SLP, IPSJ-MUS (連催) |
2021-06-18 15:00 |
ONLINE |
オンライン開催 |
クラウドソーシングを利用した音声了解度実験 ~ ウェブページ制作からデータスクリーニング ~ ○山本絢子・入野俊夫(和歌山大)・新井賢一・荒木章子・小川厚徳・木下慶介・中谷智広(NTT) SP2021-5 |
今まで音声了解度の客観評価指標を開発することを目的として、数多くの主観評価実験が行われてきた。 しかし、コロナ禍により密... [more] |
SP2021-5 pp.25-30 |
SP, IPSJ-SLP, IPSJ-MUS (連催) |
2021-06-19 09:30 |
ONLINE |
オンライン開催 |
[招待講演]エンドツーエンドニューラルネットワークによる様々な音声処理技術の統一化の試み ○渡部晋治(カーネギーメロン大) SP2021-8 |
本講演では、近年のエンドツーエンドニューラルネットワークによる音声処理の発展について解説を行う。エンドツーエンドニューラ... [more] |
SP2021-8 p.38 |
EA, SP, SIP (共催) US, IPSJ-SLP (連催) (連催) ※学会内は併催 [詳細] |
2021-03-03 14:05 |
ONLINE |
オンライン開催 |
[ポスター講演]クラウドソーシングと防音室における音声了解度実験の対比 ○山本絢子・入野俊夫(和歌山大)・新井賢一・荒木章子・小川厚徳・木下慶介・中谷智広(NTT) EA2020-73 SIP2020-104 SP2020-38 |
今まで音声了解度の客観評価指標を開発することを目的として、数多くの主観評価実験が行われてきた。 しかし、コロナ禍により密... [more] |
EA2020-73 SIP2020-104 SP2020-38 pp.79-84 |
SIS |
2020-12-01 11:25 |
ONLINE |
オンライン開催 |
[チュートリアル講演]高次統計量に基づくミュージカルノイズの制御理論 ○宮崎亮一・藤村拓弥(徳山高専) SIS2020-30 |
非線形な音声強調手法では,背景ノイズを大幅に除去することができるが,ミュージカルノイズが発生することが知られている.ミュ... [more] |
SIS2020-30 pp.18-23 |
SIS |
2020-03-06 15:00 |
埼玉 |
埼玉会館 (開催中止,技報発行あり) |
音声強調ネットワークのためのSelf-Attention機構を用いた敵対的学習 ○杉浦陽介・島村徹也(埼玉大) SIS2019-59 |
本稿は,音声強調ネットワークの性能改善に向けた新たな敵対的学習法を提案する.
提案手法では,まず生成した音声波形に対し... [more] |
SIS2019-59 pp.125-129 |
SP, EA, SIP (共催) |
2020-03-02 15:45 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
音声認識におけるEncoder-Decoderモデルの注意重みを用いたCTCモデルへの知識蒸留の評価 ○森谷崇史・佐藤 宏・田中智大・芦原孝典・増村 亮・篠原雄介(NTT) EA2019-131 SIP2019-133 SP2019-80 |
本研究ではConnectionist Temporal Classification(CTC)ベースの音声認識システムの... [more] |
EA2019-131 SIP2019-133 SP2019-80 pp.175-180 |