研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
多言語SSLモデルに基づく音声認識のノンパラレルコーパスのみを用いたドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・北岡教英(豊橋技科大) EA2023-100 SIP2023-147 SP2023-82 |
音声認識(automatic speech recognition: ASR)は様々なサービスや事業で活用されており,そ... [more] |
EA2023-100 SIP2023-147 SP2023-82 pp.232-237 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
話者適応による聴覚障害者音声認識の評価 ○高橋快斗・木内貴浩・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・小林彰夫(大和大)・北岡教英(豊橋技科大) EA2023-102 SIP2023-149 SP2023-84 |
健聴者と聴覚障害者とのコミュニケーションには,一般に手話,筆談,音声認識などが用いられる.聴覚障害者の半数以上が音声を用... [more] |
EA2023-102 SIP2023-149 SP2023-84 pp.244-249 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
x-vectorの話者空間を利用した2話者間の中間話者音声合成 ○細井颯太・木内貴浩・若林佑幸・北岡教英(豊橋技科大) EA2023-103 SIP2023-150 SP2023-85 |
近年,複数話者の声質や話し方について学習している音声合成器を用いて,学習セットに含まれていな い話者の音声を新たに合成す... [more] |
EA2023-103 SIP2023-150 SP2023-85 pp.250-255 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
潜在変数と観測データにガンマ分布を仮定したVAEによる音声振幅スペクトル表現 ○今市夏菜子・中鹿 亘(電通大) EA2023-104 SIP2023-151 SP2023-86 |
近年,データの生成において複雑な関係を表現できる深層生成モデルが注目されており,その例として変分オートエンコーダ(Var... [more] |
EA2023-104 SIP2023-151 SP2023-86 pp.256-261 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声認識器の継続学習のためのモデルアベレージング手法における重み設定方法に関する検討 ○品山健太朗・佐藤 宏・岩田具治・森 岳至・浅見太一(NTT) EA2023-105 SIP2023-152 SP2023-87 |
近年,音声認識AIの適用範囲が広がり,日々様々なデータが取得可能になっている.実用上,一つの音声認識モデルを逐次手に入る... [more] |
EA2023-105 SIP2023-152 SP2023-87 pp.262-267 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換 ○高城巽成・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) EA2023-106 SIP2023-153 SP2023-88 |
自動音声認識の分野ではニューラルネットワークの台頭により, 音声認識モデルの精度が向上し, 字幕生成や議事録作成など様々... [more] |
EA2023-106 SIP2023-153 SP2023-88 pp.268-273 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Transformerを用いた脳波信号からの音声復元の検討 ○水野友暁(電通大)・岸田拓也(愛知淑徳大)・吉村奈津江(東工大)・中鹿 亘(電通大) EA2023-108 SIP2023-155 SP2023-90 |
脳波信号から完全な音声を合成することは、困難な課題である。本稿では、脳波信号からの音声復元を、男女1人ずつ2名の声を聞い... [more] |
EA2023-108 SIP2023-155 SP2023-90 pp.277-282 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 15:25 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Clarity Prediction Challenge 2のための音声基盤モデルベースの音声了解度の客観評価指標の調査 ○山本克彦(サイバーエージェント) EA2023-119 SIP2023-166 SP2023-101 |
Whisperのエンコーダ層などを利用した音声基盤モデル(Speech Foundation Models; SFMs)... [more] |
EA2023-119 SIP2023-166 SP2023-101 pp.334-339 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 16:35 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
車内環境における音声認識のための多チャンネルブラインド音源分離の性能評価 ○竹内柚月・植野夏樹・小野順貴(都立大)・高沢剛史・島ノ江修平・種村友貴(ミライズテクノロジーズ) EA2023-127 SIP2023-174 SP2023-109 |
車内環境では,様々な種類の雑音が重畳するため音声認識が困難となる.これに対し,多チャンネルマイクを利用できる場合には,ビ... [more] |
EA2023-127 SIP2023-174 SP2023-109 pp.388-393 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 15:45 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声エージェントの印象に合致する音声の加工強度の予測 ○宮本 蓮・森田湧大・齋藤大輔・峯松信明(東大) EA2023-132 SIP2023-179 SP2023-114 |
ロボットのような音声エージェントが人間と対話する際、その印象に合う音声を選択することがエージェントへの親しみやすさの点で... [more] |
EA2023-132 SIP2023-179 SP2023-114 pp.415-420 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 16:05 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
テキスト生成の自動評価尺度に基づく音声生成の自動評価 ○佐伯高明(東大)・マイティ ソウミ(カーネギーメロン大)・高道慎之介(東大)・渡部晋治(カーネギーメロン大)・猿渡 洋(東大) EA2023-133 SIP2023-180 SP2023-115 |
音声生成の評価において,主観的評価は長らく最も重要な基準であったが,メルケプストラル歪み (mel cepstral d... [more] |
EA2023-133 SIP2023-180 SP2023-115 pp.421-426 |
CNR |
2024-01-19 14:00 |
鹿児島 |
ふれあいプラザなのはな館会議室1(指宿市) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
パーソナルテンポに同調する発話システムの実装と評価 ○宇治川遥祐・高汐一紀(慶大) CNR2023-30 |
人間は日常生活の中で、パーソナルテンポと呼ばれる自分独自のテンポをキープしている。対話の場面においてもテンポの重要性は高... [more] |
CNR2023-30 pp.25-30 |
OME |
2023-12-26 16:40 |
沖縄 |
沖縄県青年会館 |
[招待講演]神経ネットワーク型分子システム ~ エッジコンピューティングへの応用 ~ ○松本卓也(阪大) OME2023-72 |
エッジコンピューティングに有効な神経ネットワーク型分子システムを構築した。静電気力と電子トンネリングの同時測定手法を開発... [more] |
OME2023-72 pp.23-26 |
HCGSYMPO (第二種研究会) |
2023-12-11 - 2023-12-13 |
福岡 |
北九州観光コンベンションAIM-3F (ハイブリッド開催,主:現地開催,副:オンライン開催) |
単一話者特徴を利用したターンテイキング予測モデルの検証 ○大西一誉・田中宏季・中村 哲(奈良先端大) |
二者間会話の発話予測は、人間とバーチャルエージェントのターンテイキングを自然にするため重要である。多くのモデルは二者の特... [more] |
|
SIS |
2023-12-08 09:50 |
愛知 |
名古屋市立大学桜山キャンパス (ハイブリッド開催,主:現地開催,副:オンライン開催) |
フラクタル次元フィルタを用いた背景雑音下での信号の時間位置検出について 柴山秀雄(芝浦工大)・○眞壁義明(神奈川工科大)・武藤憲司(芝浦工大)・木村誠聡(神奈川工科大) SIS2023-34 |
環境基準で定めた騒音レベルより低い場合でも,近隣騒音による紛争は発生している. 背景雑音のレベルが高い条件下で,原因の対... [more] |
SIS2023-34 pp.55-60 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-02 13:30 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
拡散モデルを用いた音声強調の計算量削減 ○西 悠希(東工大)・岩野公司(東京都市大)・篠田浩一(東工大) NLC2023-14 SP2023-34 |
近年拡散モデルと呼ばれる生成モデルが注目されている. GANと比べ、拡散モデルは安定に学習できるが、生成段階の計算コスト... [more] |
NLC2023-14 SP2023-34 pp.1-6 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-02 16:00 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
聴取力と発声力をシームレスに強化するインタラクティブ性及びゲーム性の高い英語音声トレーニング教材の開発とその効果 ○峯松信明・高 英翔(東大)・中西のりこ(神戸学院大)・井上雄介・水野宏明(Carriage) NLC2023-15 SP2023-35 |
英語オーラルコミュニケーション力の向上には,提示音声から単語を聞き取る「聴取力」,文・相手の意図を理解し対話を構成する「... [more] |
NLC2023-15 SP2023-35 pp.7-12 |
EMM, EA, ASJ-H (共催) |
2023-11-23 13:00 |
富山 |
大学コンソーシアム富山「駅前キャンパス」研修室1 |
[ポスター講演]大規模事前学習モデルを用いたEnd-to-End音声認識による日本語単語了解度推定 ○服部真稀・近藤和弘(山形大) |
音声認識を利用した音声了解度推定方法の検討として, 大規模事前学習モデルに基づくEnd-to-Endな音声認識で主観評価... [more] |
EA2023-45 EMM2023-76 pp.93-97 |
EMM, EA, ASJ-H (共催) |
2023-11-24 10:30 |
富山 |
大学コンソーシアム富山「駅前キャンパス」研修室1 |
[招待講演]"話す"と"聞く"の"フシギ"な関係 ○上江洲安史(北陸先端大) EA2023-48 EMM2023-79 |
私たちが音声コミュニケーションに用いる言語音声の学習・獲得には、“話す”と“聞く”の両方が非常に重要な役割を果たしている... [more] |
EA2023-48 EMM2023-79 pp.109-112 |
ICM, NS, CQ, NV (併催) |
2023-11-22 14:35 |
愛媛 |
愛媛県男女共同参画センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
ICN/CCNにおける多視点ビデオ・音声伝送QoE向上のためのキャッシュ制御方式の一検討 ○高田祥之・布目敏郎(名工大) CQ2023-49 |
本稿では,ICN(Information-Centric Networking)/ CCN(Content-Centri... [more] |
CQ2023-49 pp.61-66 |