研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
CAS, CS (共催) |
2024-03-14 13:30 |
沖縄 |
大濱信泉記念館 |
音声信号伝送におけるセマンティックコミュニケーションの特性評価 ○岩永風杜・梅原大祐(京都工繊大) CAS2023-118 CS2023-111 |
近年,データ通信におけるデータ量は急増し,その送信には無線データ通信に必要となる空間,周波数,時間のリソースが増大してい... [more] |
CAS2023-118 CS2023-111 pp.41-46 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
潜在変数と観測データにガンマ分布を仮定したVAEによる音声振幅スペクトル表現 ○今市夏菜子・中鹿 亘(電通大) EA2023-104 SIP2023-151 SP2023-86 |
近年,データの生成において複雑な関係を表現できる深層生成モデルが注目されており,その例として変分オートエンコーダ(Var... [more] |
EA2023-104 SIP2023-151 SP2023-86 pp.256-261 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換 ○高城巽成・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) EA2023-106 SIP2023-153 SP2023-88 |
自動音声認識の分野ではニューラルネットワークの台頭により, 音声認識モデルの精度が向上し, 字幕生成や議事録作成など様々... [more] |
EA2023-106 SIP2023-153 SP2023-88 pp.268-273 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 09:30 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Enhancing Recognition of Rare Words in ASR through Error Detection and Context-Aware Error Correction ○Jiajun He・Zekun Yang・Tomoki Toda(名大) NLC2023-16 SP2023-36 |
Automatic speech recognition (ASR) systems often suffer from... [more] |
NLC2023-16 SP2023-36 pp.13-18 |
WIT, SP (共催) IPSJ-SLP (連催) [詳細] |
2023-10-14 17:05 |
福岡 |
九州工業大学(戸畑キャンパス) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Electrolaryngeal Speech Enhancement through Strong Linguistic Encoding Methods ○Lester Phillip Violeta・Wen-Chin Huang・Ding Ma・Ryuichi Yamamoto・Kazuhiro Kobayashi・Tomoki Toda(Nagoya Univ.) SP2023-33 WIT2023-24 |
Although pretraining and fine-tuning approaches have proven ... [more] |
SP2023-33 WIT2023-24 pp.33-38 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 09:30 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Neural Transducer型音声認識におけるScheduled Samplingの検討 ○森谷崇史・芦原孝典・佐藤 宏・松浦孝平・田中智大・増村 亮(NTT) EA2022-100 SIP2022-144 SP2022-64 |
本研究ではRecurrent neural network-transducer(RNNT)を用いた音声認識におけるSc... [more] |
EA2022-100 SIP2022-144 SP2022-64 pp.147-152 |
HCS |
2023-01-22 16:00 |
京都 |
京都工芸繊維大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Attention-based RNN with encoder-decoderによるサイレント日本語単語脳波の解読 ○山﨑敏正・徳永由布子・伊藤智恵子(九工大) HCS2022-74 |
頭皮脳波を利用したSSBCIJ(silent speech Brain-Computer Interface in Ja... [more] |
HCS2022-74 pp.108-111 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2022-06-18 10:50 |
ONLINE |
オンライン開催 |
[招待講演]Crazy vocoderは砕けない ~ でもちょっとくだけた未来の話を ~ ○森勢将雅(明大) SP2022-15 |
現在の音声合成研究者が論文にVocoderと記載するとき,その多くはDeep neural network (DNN)を... [more] |
SP2022-15 pp.61-66 |
EA, SIP, SP (共催) IPSJ-SLP (連催) [詳細] |
2022-03-01 12:45 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Incorporating Acoustic and Textual Information for Language Modeling in Code-switching Speech Recognition ○Roland Hartanto・Kuniaki Uto・Koichi Shinoda(TokyoTech) EA2021-73 SIP2021-100 SP2021-58 |
People who speak two or more languages tend to alternate the... [more] |
EA2021-73 SIP2021-100 SP2021-58 pp.56-63 |
SP, IPSJ-SLP, IPSJ-MUS (連催) |
2021-06-18 13:00 |
ONLINE |
オンライン開催 |
ℓ2ノルム正則化TV-CAR分析を用いた音声のF0推定 ○舟木慶一(琉球大) SP2021-2 |
線形予測(Linear Predictive Coding:LPC)分析は、スマートフォンやSkype、LINE、ZOO... [more] |
SP2021-2 pp.7-12 |
EA, SP, SIP (共催) US, IPSJ-SLP (連催) (連催) ※学会内は併催 [詳細] |
2021-03-03 14:05 |
ONLINE |
オンライン開催 |
[ポスター講演]統合型ソースフィルタネットワークによるニューラルボコーダ ○米山怜於・呉 宜樵・戸田智基(名大) EA2020-69 SIP2020-100 SP2020-34 |
本稿では,ソースフィルタ理論に基づくニューラルボコーダを単一のネットワークにより実現する手法を提案する.深層学習に基づく... [more] |
EA2020-69 SIP2020-100 SP2020-34 pp.57-62 |
SP, EA, SIP (共催) |
2020-03-03 09:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
[ポスター講演]音素セット縮小に用いる言語モデル比較 ○古明地秀治・田中聡久(東京農工大)・篠田浩一(東工大) EA2019-152 SIP2019-154 SP2019-101 |
音素セット縮小に用いる言語モデルを比較する.
音素セット縮小は,学習データが少なく全音素の学習が難しいタスクにおいて,... [more] |
EA2019-152 SIP2019-154 SP2019-101 pp.295-300 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP (連催) (併催) [詳細] |
2019-12-06 13:55 |
東京 |
NHK放送技術研究所 |
[ポスター講演]ℓ2ノルム正則化に基づく時変複素音声分析 ○舟木慶一(琉球大) SP2019-41 |
線形予測分析(LPC) は音声信号から全極型スペクトルを抽出する数理手法であり、音声符号化では欠かせ
ない要素技術とな... [more] |
SP2019-41 pp.73-77 |
ISEC, SITE, ICSS, EMM, HWS, BioX (共催) IPSJ-CSEC, IPSJ-SPT (共催) (連催) [詳細] |
2019-07-24 12:10 |
高知 |
高知工科大学 |
システムチップ依存の音響歪みに基づく録音機器識別 ○西村 明(東京情報大) ISEC2019-48 SITE2019-42 BioX2019-40 HWS2019-43 ICSS2019-46 EMM2019-51 |
本報告では、携帯情報機器によって録音された信号から、その機器のシステ
ムオンチップ(SoC)を識別するために、チッ... [more] |
ISEC2019-48 SITE2019-42 BioX2019-40 HWS2019-43 ICSS2019-46 EMM2019-51 pp.311-316 |
EA, SIP, SP (共催) |
2019-03-15 13:30 |
長崎 |
アイランド ナガサキ(長崎市) |
[ポスター講演]正則化線形予測に基づく時変複素音声分析を用いたF0推定 ○舟木慶一(琉球大) EA2018-152 SIP2018-158 SP2018-114 |
音声の線形予測 (LP) は音声のスペクトルを 10 数個の AR(自己回帰) 係数で記述できる音声符号化の基
本とな... [more] |
EA2018-152 SIP2018-158 SP2018-114 pp.311-316 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP (連催) (併催) [詳細] |
2018-12-10 13:15 |
東京 |
早稲田大学西早稲田キャンパス |
[招待講演]音声認識の方法論の変遷と展望 ~ Acoustic-to-Wordモデルを中心に ~ ○河原達也(京大) SP2018-48 |
音声認識の方法論は深層学習、特にEnd-to-Endモデルの導入で大きく変わりつつある。本稿では、従来の方法論を概観し、... [more] |
SP2018-48 pp.25-30 |
SIP, EA, SP (共催) MI (併催) [詳細] |
2018-03-20 09:00 |
沖縄 |
石垣島 ホテルミヤヒラ |
[ポスター講演]高品質音声符号化のためのスペクトル包絡・非周期性指標量子化の知覚的影響 ○宮下玄太・森勢将雅(山梨大) EA2017-145 SIP2017-154 SP2017-128 |
本稿では,フルバンド音声をボコーダを用いて分析合成する際の,音声パラメータの量子化に伴う音質劣化について検討した.高品質... [more] |
EA2017-145 SIP2017-154 SP2017-128 pp.241-244 |
SITE, EMM, ISEC, ICSS (共催) IPSJ-CSEC, IPSJ-SPT (共催) (連催) [詳細] |
2017-07-15 13:25 |
東京 |
内田洋行東京本社ショールーム |
Investigation of spikegram-based signal representation for speech fingerprints ○Dung Kim Tran・Masashi Unoki(JAIST) ISEC2017-32 SITE2017-24 ICSS2017-31 EMM2017-35 |
[more] |
ISEC2017-32 SITE2017-24 ICSS2017-31 EMM2017-35 pp.241-246 |
SP, SIP, EA (共催) |
2017-03-02 10:45 |
沖縄 |
沖縄産業支援センター |
[特別招待講演]携帯電話や放送の高音質化を支える音声音響符号化技術 ○守谷健弘(NTT) EA2016-138 SIP2016-193 SP2016-133 |
近い将来日本の超高精細度デジタル衛星放送やIPTVの高音質サービスでの利用が検討されている歪のないオーディオ・ロスレス符... [more] |
EA2016-138 SIP2016-193 SP2016-133 p.313 |
ASJ-H (共催) EA, IPSJ-MUS (連催) [詳細] |
2016-10-15 09:00 |
石川 |
国民宿舎能登小牧台 (七尾) |
[フェロー記念講演]音声音響符号化技術の進展 ○守谷健弘(NTT) EA2016-47 |
音声音響符号化の研究開発や実用化の最近の動向の中で、特に音質の改善に貢献する2つの国際標準化方式を紹介する。一つ目は20... [more] |
EA2016-47 p.109 |