講演名 2018-03-19
[ポスター講演]超広帯域音声のための低周波成分への影響を考慮した非線形帯域拡張法に基づく話者照合の検討
宮本 春奈(首都大東京), 塩田 さやか(首都大東京), 貴家 仁志(首都大東京),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では,エイリアシングの影響を考慮した非線形帯域拡張法を提案し,その有効性を客観評価および話者照合において評価している.帯域拡張法には電話音声のような狭帯域音声に適用するものだけでなく,次世代通信のための超広帯域に対応させるものなどがある.統計モデルを用いた手法によりどちらの条件においても高い品質を得ることが報告されている.一方,学習のプロセスを必要としない帯域拡張法である非線形帯域拡張法も近年報告されている.非線形帯域拡張法では非線形関数を用いることで広帯域音声を生成可能であるが一方で扱う信号がデジタル信号であるためにエイリアシングの影響を受けるという問題もあった.そこで,本研究ではエイリアシングを回避するためのフィルタを加えた非線形帯域拡張法を提案する.提案法を評価するための実験としてPESQおよびRMS-LSDという客観的評価尺度による比較と話者照合実験を行った.特に話者照合実験において信号を16kHzから32kHzへ拡張した場合に提案法は従来法と比較して29.7%のエラー削減率を得たことを報告する.
抄録(英) This paper has two aims that are to propose a novel bandwidth extension (BWE) method considering aliasing artifacts, and to apply various BWE methods to speaker verification to evaluate the effectiveness of the BWE ones. There are bandwidth extension methods not only to enhance narrowband signals but also to adapt signals to super-wideband systems. It has been reported that statistical based BWE approaches can estimate clear wideband and super-wideband signals. Recently, a non-linear BWE method has also been reported as a resynthesis approach. In this paper, it is first pointed out that digital signals generated by the non-linear BWE methods include some aliasing artifacts due to the band limitation to be decided according to the sampling frequency. Next, a new non-linear artificial BWE method, which allows us to avoid the influence of aliasing artifacts, is proposed. Moreover, to evaluate the proposed framework, speaker verification experiments and objective tests, i.e. PESQ and RMS-LSD, are conducted. Especially, experimental results show that speech signals extended to 32 kHz by the proposed framework provide the error reduction of 29.7%, compared with conventional methods.
キーワード(和) 非線形帯域拡張 / エイリアシング / 話者照合 / PESQ / RMS-LSD
キーワード(英) non-linear artificial bandwidth extension / aliasing artifacts / speaker verification / PESQ / RMS-LSD
資料番号 EA2017-110,SIP2017-119,SP2017-93
発行日 2018-03-12 (EA, SIP, SP)

研究会情報
研究会 SIP / EA / SP / MI
開催期間 2018/3/19(から2日開催)
開催地(和) 石垣島 ホテルミヤヒラ
開催地(英)
テーマ(和) 音声,応用/電気音響,信号処理,一般 [SIP,EA,SP]/ 医用画像工学一般 [MI]
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics [SIP, EA, SP]/ Medical Image Engineering, Analysis, Recognition, etc. [MI]
委員長氏名(和) 奥田 正浩(北九州市大) / 島内 末廣(NTT) / 山下 洋一(立命館大) / 森 健策(名大)
委員長氏名(英) Masahiro Okuda(Univ. of Kitakyushu) / Suehiro Shimauchi(NTT) / Yoichi Yamashita(Ritsumeikan Univ.) / Kensaku Mori(Nagoya Univ.)
副委員長氏名(和) 村松 正吾(新潟大) / 相川 直幸(東京理科大) / 水町 光徳(九州工業大) / 森 大毅(宇都宮大) / 河田 佳樹(徳島大) / 木村 裕一(近畿大)
副委員長氏名(英) Shogo Muramatsu(Niigata Univ.) / Naoyuki Aikawa(TUS) / Mitsunori Mizumachi(Kyutech) / Hiroki Mori(Utsunomiya Univ.) / Yoshiki Kawata(Tokushima Univ.) / Yuichi Kimura(Kinki Univ.)
幹事氏名(和) 宮田 高道(千葉工大) / 渡邊 修(拓殖大) / 渡邉 貫治(秋田県立大) / 武岡 成人(静岡理工科大) / 西田 昌史(静岡大) / 坂野 秀樹(名城大) / 北坂 孝幸(愛知工大) / 本谷 秀堅(名工大)
幹事氏名(英) Takamichi Miyata(Chiba Inst. of Tech.) / Osamu Watanabe(Takushoku Univ.) / Kanji Watanabe(Akita Pref. Univ.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Masafumi Nishida(Shizuoka Univ.) / Hideki Banno(Meijo Univ.) / Takayuki Kitasaka(Aichi Inst. of Tech.) / Hidekata Hontani(Nagoya Inst. of Tech.)
幹事補佐氏名(和) 中本 昌由(広島大) / TREVINO Jorge(東北大) / 伊藤 信貴(NTT) / 橋本 佳(名工大) / 小橋川 哲(NTT) / 原口 亮(兵庫県立大) / 平野 靖(山口大)
幹事補佐氏名(英) Masayoshi Nakamoto(Hiroshima Univ.ひろ) / TREVINO Jorge(Tohoku Univ.) / Nobutaka Ito(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Satoshi Kobashikawa(NTT) / Ryo Haraguchi(Univ. of Hyogo) / Yasushi Hirano(Yamaguchi Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Signal Processing / Technical Committee on Engineering Acoustics / Technical Committee on Speech / Technical Committee on Medical Imaging
本文の言語 JPN
タイトル(和) [ポスター講演]超広帯域音声のための低周波成分への影響を考慮した非線形帯域拡張法に基づく話者照合の検討
サブタイトル(和)
タイトル(英) [Poster Presentation] Speaker verification based on non-linear bandwidth extension considering aliasing artifacts for super-wideband applications
サブタイトル(和) *
キーワード(1)(和/英) 非線形帯域拡張 / non-linear artificial bandwidth extension
キーワード(2)(和/英) エイリアシング / aliasing artifacts
キーワード(3)(和/英) 話者照合 / speaker verification
キーワード(4)(和/英) PESQ / PESQ
キーワード(5)(和/英) RMS-LSD / RMS-LSD
第 1 著者 氏名(和/英) 宮本 春奈 / Haruna Miyamoto
第 1 著者 所属(和/英) 首都大学東京(略称:首都大東京)
Tokyo Metropolitan University(略称:Tokyo Metropolitan Univ.)
第 2 著者 氏名(和/英) 塩田 さやか / Sayaka Shiota
第 2 著者 所属(和/英) 首都大学東京(略称:首都大東京)
Tokyo Metropolitan University(略称:Tokyo Metropolitan Univ.)
第 3 著者 氏名(和/英) 貴家 仁志 / Hitoshi Kiya
第 3 著者 所属(和/英) 首都大学東京(略称:首都大東京)
Tokyo Metropolitan University(略称:Tokyo Metropolitan Univ.)
発表年月日 2018-03-19
資料番号 EA2017-110,SIP2017-119,SP2017-93
巻番号(vol) vol.117
号番号(no) EA-515,SIP-516,SP-517
ページ範囲 pp.51-55(EA), pp.51-55(SIP), pp.51-55(SP),
ページ数 5
発行日 2018-03-12 (EA, SIP, SP)