研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
CAS, CS (共催) |
2024-03-14 13:30 |
沖縄 |
大濱信泉記念館 |
音声信号伝送におけるセマンティックコミュニケーションの特性評価 ○岩永風杜・梅原大祐(京都工繊大) CAS2023-118 CS2023-111 |
近年,データ通信におけるデータ量は急増し,その送信には無線データ通信に必要となる空間,周波数,時間のリソースが増大してい... [more] |
CAS2023-118 CS2023-111 pp.41-46 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 15:45 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声言語モデル学習における方言音声コーパスの録音品質と書き起こしの影響について ○甲斐充彦・三輪祥吾・神谷悠太・遠山拓実(静岡大) |
我々は2022年に公開された日本語諸方言コーパスCOJADSを利用し、多言語音声による大規模事前学習モデルを応用した自動... [more] |
|
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
話者性を制御可能な音声合成のための話者埋め込み空間に関する実験的検討 ○森田湧大・齋藤大輔・峯松信明(東大) EA2023-93 SIP2023-140 SP2023-75 |
本論文では,弁別能力の異なる話者埋め込み抽出モデルを用いた,話者性の制御が可能な音声合成モデルの比較実験について報告する... [more] |
EA2023-93 SIP2023-140 SP2023-75 pp.190-195 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
下位N位スコア平均に基づくMOS予測モデル学習 ○近藤祐斗・亀岡弘和・田中 宏・金子卓弘(NTT) EA2023-94 SIP2023-141 SP2023-76 |
主観音声品質予測は時間や手間のかかる被験者アンケートを行うことなく自動的に音声の主観音声品質を計算するというタスクである... [more] |
EA2023-94 SIP2023-141 SP2023-76 pp.196-201 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Remixed2Remixedを用いた音声強調のモデル学習法の改善 ○李 莉・関 翔悟(サイバーエージェント) EA2023-95 SIP2023-142 SP2023-77 |
深層学習を用いた音声強調において,ノイジー音声とクリーン音声のペアを学習データとする教師あり学習モデルは,学習データと異... [more] |
EA2023-95 SIP2023-142 SP2023-77 pp.202-207 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
VQ-VAEに基づく解釈可能なアクセント潜在変数を用いた多方言音声合成 ○山内一輝・齋藤佑樹・猿渡 洋(東大) EA2023-98 SIP2023-145 SP2023-80 |
本稿では,目的話者の母方言と同じ方言のテキスト音声合成(Text-to-Speech: TTS)を目的とする "Intr... [more] |
EA2023-98 SIP2023-145 SP2023-80 pp.220-225 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
x-vectorの話者空間を利用した2話者間の中間話者音声合成 ○細井颯太・木内貴浩・若林佑幸・北岡教英(豊橋技科大) EA2023-103 SIP2023-150 SP2023-85 |
近年,複数話者の声質や話し方について学習している音声合成器を用いて,学習セットに含まれていな い話者の音声を新たに合成す... [more] |
EA2023-103 SIP2023-150 SP2023-85 pp.250-255 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換 ○高城巽成・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) EA2023-106 SIP2023-153 SP2023-88 |
自動音声認識の分野ではニューラルネットワークの台頭により, 音声認識モデルの精度が向上し, 字幕生成や議事録作成など様々... [more] |
EA2023-106 SIP2023-153 SP2023-88 pp.268-273 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 16:35 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音光変換デバイス「ブリンキー」の分散配置に基づく発話検出のシミュレーション評価 ○本山智司・植野夏樹・安田昌弘(都立大)・木下裕磨(東海大)・小野順貴(都立大) EA2023-126 SIP2023-173 SP2023-108 |
本研究では,分散配置した音光変換デバイス「ブリンキー」を活用した発話検出を目的とする.本稿では初期検討として,ブリンキー... [more] |
EA2023-126 SIP2023-173 SP2023-108 pp.382-387 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-02 16:00 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
聴取力と発声力をシームレスに強化するインタラクティブ性及びゲーム性の高い英語音声トレーニング教材の開発とその効果 ○峯松信明・高 英翔(東大)・中西のりこ(神戸学院大)・井上雄介・水野宏明(Carriage) NLC2023-15 SP2023-35 |
英語オーラルコミュニケーション力の向上には,提示音声から単語を聞き取る「聴取力」,文・相手の意図を理解し対話を構成する「... [more] |
NLC2023-15 SP2023-35 pp.7-12 |
EMM, EA, ASJ-H (共催) |
2023-11-23 13:00 |
富山 |
大学コンソーシアム富山「駅前キャンパス」研修室1 |
[ポスター講演]大規模事前学習モデルを用いたEnd-to-End音声認識による日本語単語了解度推定 ○服部真稀・近藤和弘(山形大) |
音声認識を利用した音声了解度推定方法の検討として, 大規模事前学習モデルに基づくEnd-to-Endな音声認識で主観評価... [more] |
EA2023-45 EMM2023-76 pp.93-97 |
PRMU, IPSJ-CVIM, IPSJ-DCC, IPSJ-CGVI (連催) |
2023-11-17 09:20 |
鳥取 |
鳥取県立生涯学習センター(県民ふれあい会館) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
変分自己符号化器を用いた発話時の動作生成の研究 ○賈 辰一・篠田浩一(東工大) PRMU2023-29 |
発話時の動作生成は, 発話音声に対応するジェスチャーを生成する研究である. 従来研究の手法は大きく分けて二つある.決定論... [more] |
PRMU2023-29 pp.74-79 |
WIT, SP (共催) IPSJ-SLP (連催) [詳細] |
2023-10-14 16:40 |
福岡 |
九州工業大学(戸畑キャンパス) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Sequence-to-sequence Voice Conversion for Electrolaryngeal Speech Enhancement with Multi-stage Pretraining and Fine-tuning Techniques ○Ding Ma・Lester Phillip Violeta・Kazuhiro Kobayashi・Tomoki Toda(Nagoya Univ.) SP2023-32 WIT2023-23 |
Sequence-to-sequence (seq2seq) voice conversion (VC) models ... [more] |
SP2023-32 WIT2023-23 pp.27-32 |
WIT, SP (共催) IPSJ-SLP (連催) [詳細] |
2023-10-14 17:05 |
福岡 |
九州工業大学(戸畑キャンパス) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Electrolaryngeal Speech Enhancement through Strong Linguistic Encoding Methods ○Lester Phillip Violeta・Wen-Chin Huang・Ding Ma・Ryuichi Yamamoto・Kazuhiro Kobayashi・Tomoki Toda(Nagoya Univ.) SP2023-33 WIT2023-24 |
Although pretraining and fine-tuning approaches have proven ... [more] |
SP2023-33 WIT2023-24 pp.33-38 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]発話音声の感情情報に基づく色つき字幕画像生成の検討 ○中村史也(神戸大)・相原 龍(三菱電機)・高島遼一・滝口哲也(神戸大)・伊谷裕介(三菱電機) SP2023-11 |
従来の音声認識による自動字幕生成システムでは,発話に含まれる感情などのパラ言語情報を考慮していないため,皮肉表現や多義語... [more] |
SP2023-11 pp.54-59 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
暗黙的言語情報を置換するCTCデコーダを用いた ストリーミング音声認識 ○高城巽成(豊橋技科大)・小川厚徳(NTT)・北岡教英・若林佑幸(豊橋技科大) SP2023-12 |
音声認識技術は, 音声認識モデルの精度向上により, さまざまな分野で利用されているが, 学習に用いるデータと認識対象とな... [more] |
SP2023-12 pp.60-64 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
目標ドメイン音声を用いた自己教師あり学習に基づく音声認識モデルのドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸・北岡教英(豊橋技科大) SP2023-19 |
本研究では,目標ドメインの書き起こしテキストデータを利用せず,目標ドメインの音声データのみを用い,目標外ドメインで事前学... [more] |
SP2023-19 pp.91-96 |
ET |
2023-03-14 14:10 |
徳島 |
徳島大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
アイトラッキングを用いたHMD型接客訓練支援システム ○大上毅瑠・松原行宏・毛利考佑・岡本 勝(広島市大) ET2022-71 |
本研究では,アイトラッキングが可能なHMDを用いて,発話する際に視線を相手の顔に向ける,相手の容姿や行動によって適切な接... [more] |
ET2022-71 pp.73-78 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 09:30 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Neural Transducer型音声認識におけるScheduled Samplingの検討 ○森谷崇史・芦原孝典・佐藤 宏・松浦孝平・田中智大・増村 亮(NTT) EA2022-100 SIP2022-144 SP2022-64 |
本研究ではRecurrent neural network-transducer(RNNT)を用いた音声認識におけるSc... [more] |
EA2022-100 SIP2022-144 SP2022-64 pp.147-152 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 11:00 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
日本語音声合成におけるアクセント句韻律特徴量の表現と予測 ○佐藤匡紀・高道慎之介・猿渡 洋(東大) EA2022-108 SIP2022-152 SP2022-72 |
音声合成を対話システムやオーディオブックにおける感情表現などさまざまな場面で利用するには,読み上げ口調だけではなく自然で... [more] |
EA2022-108 SIP2022-152 SP2022-72 pp.197-202 |