研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
EA |
2024-05-22 14:15 |
ONLINE |
オンライン開催 |
音声強調で音声認識性能はなぜ劣化するのか? ~ 音声強調誤差が音声認識性能に与える影響の分析 ~ ○落合 翼(NTT)・岩本一真(同志社大)・マーク デルクロア・池下林太郎・佐藤 宏・荒木章子(NTT)・片桐 滋(同志社大) |
(ご登録済みです.開催日以降に掲載されます) [more] |
|
EA |
2024-05-22 16:50 |
ONLINE |
オンライン開催 |
[招待講演]拡散モデルを用いた生成モデルの基礎と音声強調と分離への応用 ○シャイブラー ロビン(LINEヤフー) |
(ご登録済みです.開催日以降に掲載されます) [more] |
|
HIP, HCS (共催) HI-SIGCOASTER (連催) [詳細] |
2024-05-13 13:20 |
沖縄 |
沖縄産業支援センター |
Strategies to encode non-speech sounds into language: A developmental study ○Kaede Hattori・Shoko Miyauchi・Kazuhide Hashiya(Kyushu Univ.) |
[more] |
|
HIP, HCS (共催) HI-SIGCOASTER (連催) [詳細] |
2024-05-14 13:50 |
沖縄 |
沖縄産業支援センター |
英語における条件付き謝罪 ~ 発話行為論的分析と誠実性評価に基づく検証 ~ ○坂本暁彦(東京電機大)・髙木幸子・ケビン M マクマナス(常磐大) |
(ご登録済みです.開催日以降に掲載されます) [more] |
|
HIP, HCS (共催) HI-SIGCOASTER (連催) [詳細] |
2024-05-14 14:10 |
沖縄 |
沖縄産業支援センター |
録画型採用面接における発話特徴に関する検討 ○髙木幸子(常磐大)・伊藤博晃(神奈川大)・安田 孝(城西国際大)・渡邊伸行(金沢工大)・澤田奈々実(早大)・渋井 進(支学機構)・森 一将(千葉大) |
(ご登録済みです.開催日以降に掲載されます) [more] |
|
SIS |
2024-03-14 13:00 |
神奈川 |
神奈川工科大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
閾値を考慮した雑音下での信号の時間位置検出について ~ フラクタル次元フィルタの応用 ~ 柴山秀雄(芝浦工大)・○眞壁義明(神奈川工科大)・武藤憲司(芝浦工大)・木村誠聡(神奈川工科大) SIS2023-45 |
近隣騒音による紛争は,音圧レベルが低くても起こりうる. このような場合,目的音の音圧レベルは背景騒音よりも低いことが多い... [more] |
SIS2023-45 pp.1-6 |
CAS, CS (共催) |
2024-03-14 13:30 |
沖縄 |
大濱信泉記念館 |
音声信号伝送におけるセマンティックコミュニケーションの特性評価 ○岩永風杜・梅原大祐(京都工繊大) CAS2023-118 CS2023-111 |
近年,データ通信におけるデータ量は急増し,その送信には無線データ通信に必要となる空間,周波数,時間のリソースが増大してい... [more] |
CAS2023-118 CS2023-111 pp.41-46 |
CAS, CS (共催) |
2024-03-14 15:55 |
沖縄 |
大濱信泉記念館 |
スペクトル置換による音源分離信号の残留ノイズ除去 ○齋藤大雅・陶山健仁(東京電機大) CAS2023-122 CS2023-115 |
複数の複素重み付け加算回路の乗算に基づく音源分離手法は高い抑圧性能を有するが,抑圧が不十分の時間区間では妨害音が残留する... [more] |
CAS2023-122 CS2023-115 pp.64-69 |
IE, MVE, IMQ (共催) CQ (併催) [詳細] |
2024-03-14 16:20 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
ユーザの発話積極性に連動するキャラクタの応答表現の印象 ○松村直季・米澤朋子(関西大) IMQ2023-51 IE2023-106 MVE2023-80 |
本研究は,外国語対面対話における発話の積極性向上を目的とする.これまで,ウォークスルー型RPGにおけるキャラクタとのやり... [more] |
IMQ2023-51 IE2023-106 MVE2023-80 pp.208-213 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 10:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
年齢情報とのマルチタスク学習による高齢者音声認識の高精度化 ○新惠拓実・木内貴浩・若林佑幸・北岡教英(豊橋技科大) EA2023-64 SIP2023-111 SP2023-46 |
高齢者の音声は,一般にスマートスピーカーなどに使用されている音声認識機では一般話者に比べて精度 が低くなってしまう.これ... [more] |
EA2023-64 SIP2023-111 SP2023-46 pp.19-24 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 15:45 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声言語モデル学習における方言音声コーパスの録音品質と書き起こしの影響について ○甲斐充彦・三輪祥吾・神谷悠太・遠山拓実(静岡大) |
我々は2022年に公開された日本語諸方言コーパスCOJADSを利用し、多言語音声による大規模事前学習モデルを応用した自動... [more] |
|
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 16:45 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
複数のラグ窓対を用いた音声基本周波数と周期性尺度の推定 ○越森道貴(電通大)・嵯峨山茂樹(東大/電通大)・中鹿 亘(電通大) EA2023-75 SIP2023-122 SP2023-57 |
LPCにおける変形相関法の原理を拡張し、短時間音声信号スペクトルから基本周波数と周期性尺度を推定するための手法としてラグ... [more] |
EA2023-75 SIP2023-122 SP2023-57 pp.85-90 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
話者性を制御可能な音声合成のための話者埋め込み空間に関する実験的検討 ○森田湧大・齋藤大輔・峯松信明(東大) EA2023-93 SIP2023-140 SP2023-75 |
本論文では,弁別能力の異なる話者埋め込み抽出モデルを用いた,話者性の制御が可能な音声合成モデルの比較実験について報告する... [more] |
EA2023-93 SIP2023-140 SP2023-75 pp.190-195 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
下位N位スコア平均に基づくMOS予測モデル学習 ○近藤祐斗・亀岡弘和・田中 宏・金子卓弘(NTT) EA2023-94 SIP2023-141 SP2023-76 |
主観音声品質予測は時間や手間のかかる被験者アンケートを行うことなく自動的に音声の主観音声品質を計算するというタスクである... [more] |
EA2023-94 SIP2023-141 SP2023-76 pp.196-201 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Remixed2Remixedを用いた音声強調のモデル学習法の改善 ○李 莉・関 翔悟(サイバーエージェント) EA2023-95 SIP2023-142 SP2023-77 |
深層学習を用いた音声強調において,ノイジー音声とクリーン音声のペアを学習データとする教師あり学習モデルは,学習データと異... [more] |
EA2023-95 SIP2023-142 SP2023-77 pp.202-207 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
VQ-VAEに基づく解釈可能なアクセント潜在変数を用いた多方言音声合成 ○山内一輝・齋藤佑樹・猿渡 洋(東大) EA2023-98 SIP2023-145 SP2023-80 |
本稿では,目的話者の母方言と同じ方言のテキスト音声合成(Text-to-Speech: TTS)を目的とする "Intr... [more] |
EA2023-98 SIP2023-145 SP2023-80 pp.220-225 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
大規模言語モデルを活用した電子カルテ一括音声入力インタフェースの構築と評価 ○前島 亮・北岡教英(豊橋技科大) EA2023-99 SIP2023-146 SP2023-81 |
本研究では医療従事者が電子カルテ入力業務をより効率的に行うことを目的とし, 大規模言語モデルを活用した電子カルテ一括音声... [more] |
EA2023-99 SIP2023-146 SP2023-81 pp.226-231 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
多言語SSLモデルに基づく音声認識のノンパラレルコーパスのみを用いたドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・北岡教英(豊橋技科大) EA2023-100 SIP2023-147 SP2023-82 |
音声認識(automatic speech recognition: ASR)は様々なサービスや事業で活用されており,そ... [more] |
EA2023-100 SIP2023-147 SP2023-82 pp.232-237 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
話者適応による聴覚障害者音声認識の評価 ○高橋快斗・木内貴浩・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・小林彰夫(大和大)・北岡教英(豊橋技科大) EA2023-102 SIP2023-149 SP2023-84 |
健聴者と聴覚障害者とのコミュニケーションには,一般に手話,筆談,音声認識などが用いられる.聴覚障害者の半数以上が音声を用... [more] |
EA2023-102 SIP2023-149 SP2023-84 pp.244-249 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
x-vectorの話者空間を利用した2話者間の中間話者音声合成 ○細井颯太・木内貴浩・若林佑幸・北岡教英(豊橋技科大) EA2023-103 SIP2023-150 SP2023-85 |
近年,複数話者の声質や話し方について学習している音声合成器を用いて,学習セットに含まれていな い話者の音声を新たに合成す... [more] |
EA2023-103 SIP2023-150 SP2023-85 pp.250-255 |