研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
EA |
2024-05-22 14:15 |
ONLINE |
オンライン開催 |
音声強調で音声認識性能はなぜ劣化するのか? ~ 音声強調誤差が音声認識性能に与える影響の分析 ~ ○落合 翼(NTT)・岩本一真(同志社大)・マーク デルクロア・池下林太郎・佐藤 宏・荒木章子(NTT)・片桐 滋(同志社大) |
(ご登録済みです.開催日以降に掲載されます) [more] |
|
SIS |
2024-03-14 14:00 |
神奈川 |
神奈川工科大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
複数人対話環境における発話推定の学習データの分割数及び組み合わせに関する考察 ○上村海斗・堀尾恵一(九工大) SIS2023-48 |
今日,会議・ニュース・電話音声などを主な対象として話者ダイアライゼーションと呼ばれる発話区間検出技術の重要性が増してきて... [more] |
SIS2023-48 pp.17-20 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 10:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
年齢情報とのマルチタスク学習による高齢者音声認識の高精度化 ○新惠拓実・木内貴浩・若林佑幸・北岡教英(豊橋技科大) EA2023-64 SIP2023-111 SP2023-46 |
高齢者の音声は,一般にスマートスピーカーなどに使用されている音声認識機では一般話者に比べて精度 が低くなってしまう.これ... [more] |
EA2023-64 SIP2023-111 SP2023-46 pp.19-24 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 15:45 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声言語モデル学習における方言音声コーパスの録音品質と書き起こしの影響について ○甲斐充彦・三輪祥吾・神谷悠太・遠山拓実(静岡大) |
我々は2022年に公開された日本語諸方言コーパスCOJADSを利用し、多言語音声による大規模事前学習モデルを応用した自動... [more] |
|
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
大規模言語モデルを活用した電子カルテ一括音声入力インタフェースの構築と評価 ○前島 亮・北岡教英(豊橋技科大) EA2023-99 SIP2023-146 SP2023-81 |
本研究では医療従事者が電子カルテ入力業務をより効率的に行うことを目的とし, 大規模言語モデルを活用した電子カルテ一括音声... [more] |
EA2023-99 SIP2023-146 SP2023-81 pp.226-231 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
多言語SSLモデルに基づく音声認識のノンパラレルコーパスのみを用いたドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・北岡教英(豊橋技科大) EA2023-100 SIP2023-147 SP2023-82 |
音声認識(automatic speech recognition: ASR)は様々なサービスや事業で活用されており,そ... [more] |
EA2023-100 SIP2023-147 SP2023-82 pp.232-237 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
話者適応による聴覚障害者音声認識の評価 ○高橋快斗・木内貴浩・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・小林彰夫(大和大)・北岡教英(豊橋技科大) EA2023-102 SIP2023-149 SP2023-84 |
健聴者と聴覚障害者とのコミュニケーションには,一般に手話,筆談,音声認識などが用いられる.聴覚障害者の半数以上が音声を用... [more] |
EA2023-102 SIP2023-149 SP2023-84 pp.244-249 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声認識器の継続学習のためのモデルアベレージング手法における重み設定方法に関する検討 ○品山健太朗・佐藤 宏・岩田具治・森 岳至・浅見太一(NTT) EA2023-105 SIP2023-152 SP2023-87 |
近年,音声認識AIの適用範囲が広がり,日々様々なデータが取得可能になっている.実用上,一つの音声認識モデルを逐次手に入る... [more] |
EA2023-105 SIP2023-152 SP2023-87 pp.262-267 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換 ○高城巽成・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) EA2023-106 SIP2023-153 SP2023-88 |
自動音声認識の分野ではニューラルネットワークの台頭により, 音声認識モデルの精度が向上し, 字幕生成や議事録作成など様々... [more] |
EA2023-106 SIP2023-153 SP2023-88 pp.268-273 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 16:35 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
車内環境における音声認識のための多チャンネルブラインド音源分離の性能評価 ○竹内柚月・植野夏樹・小野順貴(都立大)・高沢剛史・島ノ江修平・種村友貴(ミライズテクノロジーズ) EA2023-127 SIP2023-174 SP2023-109 |
車内環境では,様々な種類の雑音が重畳するため音声認識が困難となる.これに対し,多チャンネルマイクを利用できる場合には,ビ... [more] |
EA2023-127 SIP2023-174 SP2023-109 pp.388-393 |
OME |
2023-12-26 16:40 |
沖縄 |
沖縄県青年会館 |
[招待講演]神経ネットワーク型分子システム ~ エッジコンピューティングへの応用 ~ ○松本卓也(阪大) OME2023-72 |
エッジコンピューティングに有効な神経ネットワーク型分子システムを構築した。静電気力と電子トンネリングの同時測定手法を開発... [more] |
OME2023-72 pp.23-26 |
EMM, EA, ASJ-H (共催) |
2023-11-23 13:00 |
富山 |
大学コンソーシアム富山「駅前キャンパス」研修室1 |
[ポスター講演]大規模事前学習モデルを用いたEnd-to-End音声認識による日本語単語了解度推定 ○服部真稀・近藤和弘(山形大) |
音声認識を利用した音声了解度推定方法の検討として, 大規模事前学習モデルに基づくEnd-to-Endな音声認識で主観評価... [more] |
EA2023-45 EMM2023-76 pp.93-97 |
MIKA (第三種研究会) |
2023-10-11 14:30 |
沖縄 |
沖縄県市町村自治会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]エッジコンピューティングを用いた音声認識支援ARシステム ○馬場大寿・緑川 諒・瀬名波拓巳・賣井坂柊誠・朝香卓也(都立大) |
一側性難聴者は音の定位や音声の認識が困難である.またノイズキャンセリングイヤホン等の機器の利用者は,周辺の音声を認識でき... [more] |
|
ET |
2023-07-14 13:10 |
北海道 |
室蘭工業大学+オンライン開催 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声認識機能を活用した英語の発音練習について ○梅澤克之(湘南工科大)・中澤 真(会津大短大部)・中野美知子・平澤茂一(早大) ET2023-9 |
音声認識機能の普及とともに,近年のAIの進化は目覚ましいものがある.また,興味のある分野を独学で勉強する人が増えている.... [more] |
ET2023-9 pp.1-6 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]発話音声の感情情報に基づく色つき字幕画像生成の検討 ○中村史也(神戸大)・相原 龍(三菱電機)・高島遼一・滝口哲也(神戸大)・伊谷裕介(三菱電機) SP2023-11 |
従来の音声認識による自動字幕生成システムでは,発話に含まれる感情などのパラ言語情報を考慮していないため,皮肉表現や多義語... [more] |
SP2023-11 pp.54-59 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
暗黙的言語情報を置換するCTCデコーダを用いた ストリーミング音声認識 ○高城巽成(豊橋技科大)・小川厚徳(NTT)・北岡教英・若林佑幸(豊橋技科大) SP2023-12 |
音声認識技術は, 音声認識モデルの精度向上により, さまざまな分野で利用されているが, 学習に用いるデータと認識対象とな... [more] |
SP2023-12 pp.60-64 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
目標ドメイン音声を用いた自己教師あり学習に基づく音声認識モデルのドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸・北岡教英(豊橋技科大) SP2023-19 |
本研究では,目標ドメインの書き起こしテキストデータを利用せず,目標ドメインの音声データのみを用い,目標外ドメインで事前学... [more] |
SP2023-19 pp.91-96 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
言語情報と言語・非言語現象を同時認識する音声認識モデルの構築 ○塩根凪人・若林佑幸・北岡教英(豊橋技科大) SP2023-22 |
近年では音声認識の技術が進歩しているが,言語情報だけ認識するものが多く,言語・非言語現象を認識できない.そこで本研究は,... [more] |
SP2023-22 pp.109-113 |
ICD |
2023-04-10 13:20 |
神奈川 |
川崎市産業振興会館10階第4会議室 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[招待講演]音声認識に向けた新方式HZO/Si FeFETリザバーコンピューティング ○名幸瑛心・トープラサートポン カシディット・中根了昌・竹中 充・高木信一(東大) ICD2023-4 |
我々はHZO/Si強誘電体ゲートFET(FeFET)を用いたリザバーコンピューティング(RC)を検証してきた.FeFET... [more] |
ICD2023-4 p.9 |
WIT, IPSJ-AAC (連催) |
2023-03-23 10:05 |
ONLINE |
オンライン開催 |
聴覚障害者のための健聴者スキー講習参加時における情報保障システムの開発 長崎 潤・向後佑香・西岡知之・○黒木速人(筑波技大) WIT2022-25 |
聴覚障害者が健聴者のスキー講習に参加する際,情報保障手段が必要になる.本研究は,スマートグラスとWeb Speech A... [more] |
WIT2022-25 pp.32-35 |