研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
EA |
2024-05-22 14:15 |
ONLINE |
オンライン開催 |
音声強調で音声認識性能はなぜ劣化するのか? ~ 音声強調誤差が音声認識性能に与える影響の分析 ~ ○落合 翼(NTT)・岩本一真(同志社大)・マーク デルクロア・池下林太郎・佐藤 宏・荒木章子(NTT)・片桐 滋(同志社大) EA2024-4 |
深層学習技術は,シングルチャネル音声強調の音声強調性能を劇的に向上させた.しかし近年の研究において,こうしたシングルチャ... [more] |
EA2024-4 pp.20-21 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 10:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
年齢情報とのマルチタスク学習による高齢者音声認識の高精度化 ○新惠拓実・木内貴浩・若林佑幸・北岡教英(豊橋技科大) EA2023-64 SIP2023-111 SP2023-46 |
高齢者の音声は,一般にスマートスピーカーなどに使用されている音声認識機では一般話者に比べて精度 が低くなってしまう.これ... [more] |
EA2023-64 SIP2023-111 SP2023-46 pp.19-24 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 15:45 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声言語モデル学習における方言音声コーパスの録音品質と書き起こしの影響について ○甲斐充彦・三輪祥吾・神谷悠太・遠山拓実(静岡大) |
我々は2022年に公開された日本語諸方言コーパスCOJADSを利用し、多言語音声による大規模事前学習モデルを応用した自動... [more] |
|
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
大規模言語モデルを活用した電子カルテ一括音声入力インタフェースの構築と評価 ○前島 亮・北岡教英(豊橋技科大) EA2023-99 SIP2023-146 SP2023-81 |
本研究では医療従事者が電子カルテ入力業務をより効率的に行うことを目的とし, 大規模言語モデルを活用した電子カルテ一括音声... [more] |
EA2023-99 SIP2023-146 SP2023-81 pp.226-231 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
多言語SSLモデルに基づく音声認識のノンパラレルコーパスのみを用いたドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・北岡教英(豊橋技科大) EA2023-100 SIP2023-147 SP2023-82 |
音声認識(automatic speech recognition: ASR)は様々なサービスや事業で活用されており,そ... [more] |
EA2023-100 SIP2023-147 SP2023-82 pp.232-237 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
話者適応による聴覚障害者音声認識の評価 ○高橋快斗・木内貴浩・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・小林彰夫(大和大)・北岡教英(豊橋技科大) EA2023-102 SIP2023-149 SP2023-84 |
健聴者と聴覚障害者とのコミュニケーションには,一般に手話,筆談,音声認識などが用いられる.聴覚障害者の半数以上が音声を用... [more] |
EA2023-102 SIP2023-149 SP2023-84 pp.244-249 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声認識器の継続学習のためのモデルアベレージング手法における重み設定方法に関する検討 ○品山健太朗・佐藤 宏・岩田具治・森 岳至・浅見太一(NTT) EA2023-105 SIP2023-152 SP2023-87 |
近年,音声認識AIの適用範囲が広がり,日々様々なデータが取得可能になっている.実用上,一つの音声認識モデルを逐次手に入る... [more] |
EA2023-105 SIP2023-152 SP2023-87 pp.262-267 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換 ○高城巽成・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) EA2023-106 SIP2023-153 SP2023-88 |
自動音声認識の分野ではニューラルネットワークの台頭により, 音声認識モデルの精度が向上し, 字幕生成や議事録作成など様々... [more] |
EA2023-106 SIP2023-153 SP2023-88 pp.268-273 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 16:35 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音光変換デバイス「ブリンキー」の分散配置に基づく発話検出のシミュレーション評価 ○本山智司・植野夏樹・安田昌弘(都立大)・木下裕磨(東海大)・小野順貴(都立大) EA2023-126 SIP2023-173 SP2023-108 |
本研究では,分散配置した音光変換デバイス「ブリンキー」を活用した発話検出を目的とする.本稿では初期検討として,ブリンキー... [more] |
EA2023-126 SIP2023-173 SP2023-108 pp.382-387 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 16:35 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
車内環境における音声認識のための多チャンネルブラインド音源分離の性能評価 ○竹内柚月・植野夏樹・小野順貴(都立大)・高沢剛史・島ノ江修平・種村友貴(ミライズテクノロジーズ) EA2023-127 SIP2023-174 SP2023-109 |
車内環境では,様々な種類の雑音が重畳するため音声認識が困難となる.これに対し,多チャンネルマイクを利用できる場合には,ビ... [more] |
EA2023-127 SIP2023-174 SP2023-109 pp.388-393 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 09:30 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Enhancing Recognition of Rare Words in ASR through Error Detection and Context-Aware Error Correction ○Jiajun He・Zekun Yang・Tomoki Toda(名大) NLC2023-16 SP2023-36 |
Automatic speech recognition (ASR) systems often suffer from... [more] |
NLC2023-16 SP2023-36 pp.13-18 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 11:05 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]Enhancing Multi-Accent Automated Speech Recognition with Accent-Activated Adapters ○Yuqin Lin・Longbiao Wang・Jianwu Dang(Tianjin Univ. & Univ. of Tokyo)・Nobuaki Minematsu(Univ. of Tokyo) NLC2023-18 SP2023-38 |
This paper proposes the Accent-Activated adapter (AccentAct)... [more] |
NLC2023-18 SP2023-38 pp.25-30 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 11:05 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]Enhancing Dysarthric Speech Recognition with Auxiliary Feature Fusion Module: Exploring Articulatory-related Features from Foundation Models ○Yuqin Lin・Longbiao Wang・Jianwu Dang(Tianjin Univ. & Univ. of Tokyo)・Nobuaki Minematsu(Univ. of Tokyo) NLC2023-19 SP2023-39 |
Addressing dysarthric speech variability in Automatic Speech... [more] |
NLC2023-19 SP2023-39 pp.31-36 |
EMM, EA, ASJ-H (共催) |
2023-11-23 13:00 |
富山 |
大学コンソーシアム富山「駅前キャンパス」研修室1 |
[ポスター講演]大規模事前学習モデルを用いたEnd-to-End音声認識による日本語単語了解度推定 ○服部真稀・近藤和弘(山形大) |
音声認識を利用した音声了解度推定方法の検討として, 大規模事前学習モデルに基づくEnd-to-Endな音声認識で主観評価... [more] |
EA2023-45 EMM2023-76 pp.93-97 |
ET |
2023-10-21 15:30 |
長野 |
信州大学工学部 |
生成系AIと初級外国語学習者のCode Switching発話「聴取」パフォーマンス ○砂岡和子(早大)・徐 勤(京大) ET2023-23 |
教員が日本語と中国語をCode-switching(CS)する初級中国語の授業発話を,Whisperモデルを用いて自動認... [more] |
ET2023-23 pp.33-37 |
ET |
2023-07-14 13:10 |
北海道 |
室蘭工業大学+オンライン開催 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声認識機能を活用した英語の発音練習について ○梅澤克之(湘南工科大)・中澤 真(会津大短大部)・中野美知子・平澤茂一(早大) ET2023-9 |
音声認識機能の普及とともに,近年のAIの進化は目覚ましいものがある.また,興味のある分野を独学で勉強する人が増えている.... [more] |
ET2023-9 pp.1-6 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音素クラス属性を考慮した感情ラベル列の推定による音声感情認識 ○永瀬亮太郎・福森隆寛・山下洋一(立命館大) SP2023-9 |
近年,深層学習を利用し音声の感情を適切に分類する音声感情認識の研究が盛んに取り組まれている.本研究では特に系列化された感... [more] |
SP2023-9 pp.42-47 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]発話音声の感情情報に基づく色つき字幕画像生成の検討 ○中村史也(神戸大)・相原 龍(三菱電機)・高島遼一・滝口哲也(神戸大)・伊谷裕介(三菱電機) SP2023-11 |
従来の音声認識による自動字幕生成システムでは,発話に含まれる感情などのパラ言語情報を考慮していないため,皮肉表現や多義語... [more] |
SP2023-11 pp.54-59 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
暗黙的言語情報を置換するCTCデコーダを用いた ストリーミング音声認識 ○高城巽成(豊橋技科大)・小川厚徳(NTT)・北岡教英・若林佑幸(豊橋技科大) SP2023-12 |
音声認識技術は, 音声認識モデルの精度向上により, さまざまな分野で利用されているが, 学習に用いるデータと認識対象とな... [more] |
SP2023-12 pp.60-64 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
目標ドメイン音声を用いた自己教師あり学習に基づく音声認識モデルのドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸・北岡教英(豊橋技科大) SP2023-19 |
本研究では,目標ドメインの書き起こしテキストデータを利用せず,目標ドメインの音声データのみを用い,目標外ドメインで事前学... [more] |
SP2023-19 pp.91-96 |