研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
WIT, IPSJ-AAC (連催) |
2024-03-18 13:05 |
茨城 |
筑波技術大学春日キャンパス講堂 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
視覚障がい者に対する自動販売機利用支援システムの開発 ○近藤千紗(奈良先端大)・テオ ヴィナヤーク,平尾悠太朗・ペルスキア エルナンデス モニカ・内山英昭・清川 清(奈良先端大) WIT2023-43 |
視覚障がい者7名と眼科医1名にオンラインでグループインタビュを実施した.その結果,視覚障がい者にとって自力での自動販売機... [more] |
WIT2023-43 pp.25-30 |
SIS |
2024-03-14 13:00 |
神奈川 |
神奈川工科大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
閾値を考慮した雑音下での信号の時間位置検出について ~ フラクタル次元フィルタの応用 ~ 柴山秀雄(芝浦工大)・○眞壁義明(神奈川工科大)・武藤憲司(芝浦工大)・木村誠聡(神奈川工科大) SIS2023-45 |
近隣騒音による紛争は,音圧レベルが低くても起こりうる. このような場合,目的音の音圧レベルは背景騒音よりも低いことが多い... [more] |
SIS2023-45 pp.1-6 |
SIS |
2024-03-14 14:00 |
神奈川 |
神奈川工科大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
複数人対話環境における発話推定の学習データの分割数及び組み合わせに関する考察 ○上村海斗・堀尾恵一(九工大) SIS2023-48 |
今日,会議・ニュース・電話音声などを主な対象として話者ダイアライゼーションと呼ばれる発話区間検出技術の重要性が増してきて... [more] |
SIS2023-48 pp.17-20 |
CAS, CS (共催) |
2024-03-14 13:30 |
沖縄 |
大濱信泉記念館 |
音声信号伝送におけるセマンティックコミュニケーションの特性評価 ○岩永風杜・梅原大祐(京都工繊大) CAS2023-118 CS2023-111 |
近年,データ通信におけるデータ量は急増し,その送信には無線データ通信に必要となる空間,周波数,時間のリソースが増大してい... [more] |
CAS2023-118 CS2023-111 pp.41-46 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 10:10 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声品質と音響環境の潜在変数で条件付けたDenoising Trainingによるノイズロバスト音声変換 ○五十嵐琢斗・齋藤佑樹・関 健太郎・高道慎之介(東大)・山本龍一・橘 健太郎(LY)・猿渡 洋(東大) EA2023-63 SIP2023-110 SP2023-45 |
本稿では,ノイジーな入力音声に対し,その音声品質と音響環境を表現する潜在変数の条件付けを行うノイズロバストな音声変換を提... [more] |
EA2023-63 SIP2023-110 SP2023-45 pp.13-18 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 10:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
年齢情報とのマルチタスク学習による高齢者音声認識の高精度化 ○新惠拓実・木内貴浩・若林佑幸・北岡教英(豊橋技科大) EA2023-64 SIP2023-111 SP2023-46 |
高齢者の音声は,一般にスマートスピーカーなどに使用されている音声認識機では一般話者に比べて精度 が低くなってしまう.これ... [more] |
EA2023-64 SIP2023-111 SP2023-46 pp.19-24 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 15:45 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声言語モデル学習における方言音声コーパスの録音品質と書き起こしの影響について ○甲斐充彦・三輪祥吾・神谷悠太・遠山拓実(静岡大) |
我々は2022年に公開された日本語諸方言コーパスCOJADSを利用し、多言語音声による大規模事前学習モデルを応用した自動... [more] |
|
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 16:25 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声を用いた心理的ストレスによる心の不調有無推定モデルの構築 ○加藤花歩・高島瑛彦・菊入 圭・吉村 健(NTTドコモ) EA2023-74 SIP2023-121 SP2023-56 |
うつ病などの心の不調は早期対処が発症や悪化の抑制に繋がることが知られており,近年では心の不調が起きる前に心理的ストレスの... [more] |
EA2023-74 SIP2023-121 SP2023-56 pp.79-84 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 16:45 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
複数のラグ窓対を用いた音声基本周波数と周期性尺度の推定 ○越森道貴(電通大)・嵯峨山茂樹(東大/電通大)・中鹿 亘(電通大) EA2023-75 SIP2023-122 SP2023-57 |
LPCにおける変形相関法の原理を拡張し、短時間音声信号スペクトルから基本周波数と周期性尺度を推定するための手法としてラグ... [more] |
EA2023-75 SIP2023-122 SP2023-57 pp.85-90 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
話者性を制御可能な音声合成のための話者埋め込み空間に関する実験的検討 ○森田湧大・齋藤大輔・峯松信明(東大) EA2023-93 SIP2023-140 SP2023-75 |
本論文では,弁別能力の異なる話者埋め込み抽出モデルを用いた,話者性の制御が可能な音声合成モデルの比較実験について報告する... [more] |
EA2023-93 SIP2023-140 SP2023-75 pp.190-195 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
下位N位スコア平均に基づくMOS予測モデル学習 ○近藤祐斗・亀岡弘和・田中 宏・金子卓弘(NTT) EA2023-94 SIP2023-141 SP2023-76 |
主観音声品質予測は時間や手間のかかる被験者アンケートを行うことなく自動的に音声の主観音声品質を計算するというタスクである... [more] |
EA2023-94 SIP2023-141 SP2023-76 pp.196-201 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Remixed2Remixedを用いた音声強調のモデル学習法の改善 ○李 莉・関 翔悟(サイバーエージェント) EA2023-95 SIP2023-142 SP2023-77 |
深層学習を用いた音声強調において,ノイジー音声とクリーン音声のペアを学習データとする教師あり学習モデルは,学習データと異... [more] |
EA2023-95 SIP2023-142 SP2023-77 pp.202-207 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
VQ-VAEに基づく解釈可能なアクセント潜在変数を用いた多方言音声合成 ○山内一輝・齋藤佑樹・猿渡 洋(東大) EA2023-98 SIP2023-145 SP2023-80 |
本稿では,目的話者の母方言と同じ方言のテキスト音声合成(Text-to-Speech: TTS)を目的とする "Intr... [more] |
EA2023-98 SIP2023-145 SP2023-80 pp.220-225 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
大規模言語モデルを活用した電子カルテ一括音声入力インタフェースの構築と評価 ○前島 亮・北岡教英(豊橋技科大) EA2023-99 SIP2023-146 SP2023-81 |
本研究では医療従事者が電子カルテ入力業務をより効率的に行うことを目的とし, 大規模言語モデルを活用した電子カルテ一括音声... [more] |
EA2023-99 SIP2023-146 SP2023-81 pp.226-231 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
多言語SSLモデルに基づく音声認識のノンパラレルコーパスのみを用いたドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・北岡教英(豊橋技科大) EA2023-100 SIP2023-147 SP2023-82 |
音声認識(automatic speech recognition: ASR)は様々なサービスや事業で活用されており,そ... [more] |
EA2023-100 SIP2023-147 SP2023-82 pp.232-237 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
話者適応による聴覚障害者音声認識の評価 ○高橋快斗・木内貴浩・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・小林彰夫(大和大)・北岡教英(豊橋技科大) EA2023-102 SIP2023-149 SP2023-84 |
健聴者と聴覚障害者とのコミュニケーションには,一般に手話,筆談,音声認識などが用いられる.聴覚障害者の半数以上が音声を用... [more] |
EA2023-102 SIP2023-149 SP2023-84 pp.244-249 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
x-vectorの話者空間を利用した2話者間の中間話者音声合成 ○細井颯太・木内貴浩・若林佑幸・北岡教英(豊橋技科大) EA2023-103 SIP2023-150 SP2023-85 |
近年,複数話者の声質や話し方について学習している音声合成器を用いて,学習セットに含まれていな い話者の音声を新たに合成す... [more] |
EA2023-103 SIP2023-150 SP2023-85 pp.250-255 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
潜在変数と観測データにガンマ分布を仮定したVAEによる音声振幅スペクトル表現 ○今市夏菜子・中鹿 亘(電通大) EA2023-104 SIP2023-151 SP2023-86 |
近年,データの生成において複雑な関係を表現できる深層生成モデルが注目されており,その例として変分オートエンコーダ(Var... [more] |
EA2023-104 SIP2023-151 SP2023-86 pp.256-261 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声認識器の継続学習のためのモデルアベレージング手法における重み設定方法に関する検討 ○品山健太朗・佐藤 宏・岩田具治・森 岳至・浅見太一(NTT) EA2023-105 SIP2023-152 SP2023-87 |
近年,音声認識AIの適用範囲が広がり,日々様々なデータが取得可能になっている.実用上,一つの音声認識モデルを逐次手に入る... [more] |
EA2023-105 SIP2023-152 SP2023-87 pp.262-267 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換 ○高城巽成・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) EA2023-106 SIP2023-153 SP2023-88 |
自動音声認識の分野ではニューラルネットワークの台頭により, 音声認識モデルの精度が向上し, 字幕生成や議事録作成など様々... [more] |
EA2023-106 SIP2023-153 SP2023-88 pp.268-273 |