研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
EA |
2024-05-22 14:15 |
ONLINE |
オンライン開催 |
音声強調で音声認識性能はなぜ劣化するのか? ~ 音声強調誤差が音声認識性能に与える影響の分析 ~ ○落合 翼(NTT)・岩本一真(同志社大)・マーク デルクロア・池下林太郎・佐藤 宏・荒木章子(NTT)・片桐 滋(同志社大) |
(ご登録済みです.開催日以降に掲載されます) [more] |
|
EA |
2024-05-22 16:50 |
ONLINE |
オンライン開催 |
[招待講演]拡散モデルを用いた生成モデルの基礎と音声強調と分離への応用 ○シャイブラー ロビン(LINEヤフー) |
(ご登録済みです.開催日以降に掲載されます) [more] |
|
SIS |
2024-03-14 13:00 |
神奈川 |
神奈川工科大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
閾値を考慮した雑音下での信号の時間位置検出について ~ フラクタル次元フィルタの応用 ~ 柴山秀雄(芝浦工大)・○眞壁義明(神奈川工科大)・武藤憲司(芝浦工大)・木村誠聡(神奈川工科大) SIS2023-45 |
近隣騒音による紛争は,音圧レベルが低くても起こりうる. このような場合,目的音の音圧レベルは背景騒音よりも低いことが多い... [more] |
SIS2023-45 pp.1-6 |
CAS, CS (共催) |
2024-03-14 15:55 |
沖縄 |
大濱信泉記念館 |
スペクトル置換による音源分離信号の残留ノイズ除去 ○齋藤大雅・陶山健仁(東京電機大) CAS2023-122 CS2023-115 |
複数の複素重み付け加算回路の乗算に基づく音源分離手法は高い抑圧性能を有するが,抑圧が不十分の時間区間では妨害音が残留する... [more] |
CAS2023-122 CS2023-115 pp.64-69 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 15:45 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声言語モデル学習における方言音声コーパスの録音品質と書き起こしの影響について ○甲斐充彦・三輪祥吾・神谷悠太・遠山拓実(静岡大) |
我々は2022年に公開された日本語諸方言コーパスCOJADSを利用し、多言語音声による大規模事前学習モデルを応用した自動... [more] |
|
SIS |
2023-12-08 09:50 |
愛知 |
名古屋市立大学桜山キャンパス (ハイブリッド開催,主:現地開催,副:オンライン開催) |
フラクタル次元フィルタを用いた背景雑音下での信号の時間位置検出について 柴山秀雄(芝浦工大)・○眞壁義明(神奈川工科大)・武藤憲司(芝浦工大)・木村誠聡(神奈川工科大) SIS2023-34 |
環境基準で定めた騒音レベルより低い場合でも,近隣騒音による紛争は発生している. 背景雑音のレベルが高い条件下で,原因の対... [more] |
SIS2023-34 pp.55-60 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 09:30 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Enhancing Recognition of Rare Words in ASR through Error Detection and Context-Aware Error Correction ○Jiajun He・Zekun Yang・Tomoki Toda(名大) NLC2023-16 SP2023-36 |
Automatic speech recognition (ASR) systems often suffer from... [more] |
NLC2023-16 SP2023-36 pp.13-18 |
ET |
2023-10-21 15:30 |
長野 |
信州大学工学部 |
生成系AIと初級外国語学習者のCode Switching発話「聴取」パフォーマンス ○砂岡和子(早大)・徐 勤(京大) ET2023-23 |
教員が日本語と中国語をCode-switching(CS)する初級中国語の授業発話を,Whisperモデルを用いて自動認... [more] |
ET2023-23 pp.33-37 |
EA, ASJ-H, ASJ-MA, ASJ-SP (共催) |
2023-07-02 15:10 |
北海道 |
北大学術交流会館 |
1947年に出版された文献「Visible Speech」に残されているスペクトログラム画像からの音声復元 ○青木直史(北大) EA2023-6 |
本研究は,黎明期の文献に残されているスペクトログラム画像から音声を復元することを目的として,そのために必要となるツールの... [more] |
EA2023-6 pp.12-15 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
暗黙的言語情報を置換するCTCデコーダを用いた ストリーミング音声認識 ○高城巽成(豊橋技科大)・小川厚徳(NTT)・北岡教英・若林佑幸(豊橋技科大) SP2023-12 |
音声認識技術は, 音声認識モデルの精度向上により, さまざまな分野で利用されているが, 学習に用いるデータと認識対象とな... [more] |
SP2023-12 pp.60-64 |
HIP, HCS (共催) HI-SIGCOASTER (連催) [詳細] |
2023-05-15 10:20 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Cognitive Load Estimation of Speech-in-Noise Recall Task with State-Space Models Mateusz Dubiel(uni.lu)・○Minoru Nakayama(Tokyo Tech.)・Xin Wang(NII) HCS2023-7 HIP2023-7 |
[more] |
HCS2023-7 HIP2023-7 pp.29-32 |
ICD |
2023-04-10 13:20 |
神奈川 |
川崎市産業振興会館10階第4会議室 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[招待講演]音声認識に向けた新方式HZO/Si FeFETリザバーコンピューティング ○名幸瑛心・トープラサートポン カシディット・中根了昌・竹中 充・高木信一(東大) ICD2023-4 |
我々はHZO/Si強誘電体ゲートFET(FeFET)を用いたリザバーコンピューティング(RC)を検証してきた.FeFET... [more] |
ICD2023-4 p.9 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 13:45 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[招待講演]Speech and Language Research in the Google Tokyo Office ○Michiel Bacchiani(Google) EA2022-116 SIP2022-160 SP2022-80 |
This talk will consist of three parts. In the first part of ... [more] |
EA2022-116 SIP2022-160 SP2022-80 pp.239-240 |
HCGSYMPO (第二種研究会) |
2022-12-14 - 2022-12-16 |
香川 |
サンポート高松(香川県高松市)+ オンライン開催 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Modelling cognitive load with ocular responses during a noisy synthetic speech recall task Mateusz Dubiel(uni.lu)・○Minoru Nakayama(Tokyo Tech.)・Xin Wang(NII) |
[more] |
|
NLC, SP (共催) IPSJ-NL, IPSJ-SLP (共催) (連催) [詳細] |
2022-12-01 14:50 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
A Japanese Automatic Speech Recognition System on the Next-Gen Kaldi Framework ○Wen Shen Teo・Yasuhiro Minami(UEC) NLC2022-16 SP2022-36 |
次世代Kaldiと呼ばれる最先端の音声処理ツールキットがKaldiの後継モデルとして2021年に利用されるようになった。... [more] |
NLC2022-16 SP2022-36 pp.39-44 |
EA, EMM, ASJ-H (共催) |
2022-11-22 13:00 |
ONLINE |
オンライン開催 |
[フェロー記念講演]音声メディアのセキュリティとプライバシー保護に向けて ~ 音声情報ハイディング技術からの試み ~ ○鵜木祐史(北陸先端大) EA2022-60 EMM2022-60 |
実世界の真正データから限りなく本物に近いものとして人工的に作られたメディアは「メディアクローン」と呼ばれる.近年,このメ... [more] |
EA2022-60 EMM2022-60 pp.99-104 |
SIS, ITE-BCT (連催) |
2022-10-13 14:15 |
青森 |
八戸工業大学(1号館2階201室「多目的ホール」) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声自然性改善に向けた音声強調ネットワークに対するカプセル構造の導入 ○春日玲人・島村徹也・杉浦陽介・安井希子(埼玉大) SIS2022-12 |
音声強調の分野は世界中で幅広く研究が行われているが,音声信号処理で扱われる基本的な量の中で,振幅や周波数などに比べ,位相... [more] |
SIS2022-12 pp.7-12 |
SIP, BioX, IE, MI (共催) ITE-IST, ITE-ME (共催) (連催) [詳細] |
2022-05-20 11:30 |
熊本 |
熊本大学工学部黒髪キャンパス南地区 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Implementation of a Lightweight Automatic Speech Recognition System at the Edge ○Haotian Tan・Junichi Akita(Kanazawa Univ.) |
[more] |
|
EA, SIP, SP (共催) IPSJ-SLP (連催) [詳細] |
2022-03-01 13:10 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
IRMを用いた音声強調処理の主観了解度の上限評価 ~ 防音室実験とクラウドソーシング実験の対比 ~ ○山本絢子・入野俊夫(和歌山大)・荒木章子・新井賢一・小川厚徳・木下慶介・中谷智広(NTT) EA2021-74 SIP2021-101 SP2021-59 |
音声強調処理の客観評価指標を開発することを目的として、音声了解度の主観評価実験を防音室とクラウドソーシングで行った。ここ... [more] |
EA2021-74 SIP2021-101 SP2021-59 pp.64-69 |
EA, SIP, SP (共催) IPSJ-SLP (連催) [詳細] |
2022-03-01 14:45 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
劣決定条件下での方向情報と条件付き変分自己符号化器に基づく目標話者抽出 ○王 鋭・李 莉・戸田智基(名大) EA2021-76 SIP2021-103 SP2021-61 |
[more] |
EA2021-76 SIP2021-103 SP2021-61 pp.76-81 |