講演名 2015-06-18
空気/体内伝導マイクを併用した雑音環境下における非可聴つぶやき強調法とその評価
田尻 祐介(奈良先端大), 田中 宏(奈良先端大), 戸田 智基(奈良先端大), グラム ニュービッグ(奈良先端大), サクリアニ サクティ(奈良先端大), 中村 哲(奈良先端大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) サイレント音声コミュニケーションの実現に向けて,非可聴つぶやき(Non-Audible Murmur: NAM)を専用の体表密着型マイクで収録する枠組みが提案されている.しかし,体内伝導収録された音声の音響特徴量は,通常の空気伝導収録された音声のものと異なり,明瞭性および自然性が大きく劣化する.これを解決するため,統計的手法に基づき,NAMを通常音声やささやき声へと変換するNAM強調法が提案されている.ただし,従来の研究では,NAMを遮音室のような静穏環境下で収録しているため,実環境へ適用するには,外部雑音の影響を考慮する必要がある.本研究では,外部雑音に対する頑健性向上に向けて,体内伝導マイクおよび通常の空気伝導マイクを併用した2チャネルNAM強調法を提案する.実験的評価結果から,空気/体内伝導マイクを併用し,さらに,外部雑音の混入による直接的な影響と,外部雑音によって引き起こされる発話様式変化とを考慮した変換モデルを構築することで,雑音環境下における音響特徴量変換精度を大幅に改善できることを示す.
抄録(英) As one of the silent speech interfaces, Non-Audible Murmur (NAM) microphone which can detect an extremely soft whispered voice has been developed. Although NAM is a promising medium for silent speech communication, its intelligibility and naturalness are significantly degraded by acoustic changes caused by body-conductive recording. To address this issue, several enhancement methods based on statistical voice conversion techniques have been proposed, and their effectiveness has been confirmed in quiet environments. However, it can be expected that NAM will be used not only in quiet, but also in noisy environments, and it is thus necessary to develop enhancement methods that will also work in these cases. In this report, we propose a framework for NAM enhancement using the NAM microphone and an air-conductive microphone. Experimental results demonstrate that the proposed framework is capable of significantly improving enhancement performance in noisy environments by considering not only the effect of noise contamination but also speaking style changes caused by the noise.
キーワード(和) サイレント音声コミュニケーション / 非可聴つぶやき / 統計的声質変換 / 空気/体内伝導音声信号 / ロンバード効果
キーワード(英) silent speech communication / Non-Audible Murmur / statistical voice conversion / air- and body-conducted speech signal / Lombard effect
資料番号 PRMU2015-42,SP2015-11,WIT2015-11
発行日 2015-06-11 (PRMU, SP, WIT)

研究会情報
研究会 WIT / SP / ASJ-H / PRMU
開催期間 2015/6/18(から2日開催)
開催地(和) 新潟大学駅南キャンパス「ときめいと」
開催地(英)
テーマ(和) 福祉/音声/聴覚/パターン認識メディア理解一般
テーマ(英)
委員長氏名(和) 布川 清彦(東京国際大) / 間野 一則(芝浦工大) / 赤木 正人(北陸先端大) / 前田 英作(NTT)
委員長氏名(英) Kiyohiko Nunokawa(Tokyo International Univ.) / Kazunori Mano(Shibaura Inst. of Tech.) / Masato Akagi(北陸先端大) / Eisaku Maeda(NTT)
副委員長氏名(和) 和田 親宗(九工大) / 北岡 教英(徳島大) / 古川 茂人(NTT) / 仙田 修司(NEC) / 内田 誠一(九大)
副委員長氏名(英) Chikamune Wada(Kyushu Inst. of Tech.) / Norihide Kitaoka(Tokushima Univ.) / Shigeto Furukawa(NTT) / Shuji Senda(NEC) / Seiichi Uchida(Kyushu Univ.)
幹事氏名(和) 酒向 慎司(名工大) / 梶谷 勇(産総研) / 若月 大輔(筑波技大) / 岩野 公司(東京都市大) / 滝口 哲也(神戸大) / 程島 奈緒(東海大) / 森本 隆司(リオン) / 饗庭 絵里子(電通大) / 大山 航(三重大) / 安倍 満(デンソーアイティーラボラトリ)
幹事氏名(英) Shinji Sakou(Nagoya Inst. of Tech.) / Isamu Kajitani(AIST) / Daisuke Wakatsuki(Tsukuba Univ. of Tech.) / Koji Iwano(Tokyo City Univ.) / Tetsuya Takiguchi(Kobe Univ.) / Nao Hodoshima(東海大) / Takashi Morimoto(リオン) / Eriko Aiba(電通大) / Wataru Ohyama(Mie Univ.) / Mitsuru Anbai(DENSO IT Lab.)
幹事補佐氏名(和) 雨宮 智浩(NTT) / 塩野目 剛亮(筑波技大) / 宮城 愛美(筑波技大) / 能勢 隆(東北大) / 浅見 太一(NTT) / / 近藤 一晃(京大) / 木村 昭悟(NTT)
幹事補佐氏名(英) Tomohiro Amemiya(NTT) / Takeaki Shionome(Tsukuba Univ. of Tech.) / Manabi Miyagi(Tsukuba Univ. of Tech.) / Takashi Nose(Tohoku Univ.) / Taichi Asami(NTT) / / Kazuaki Kondo(Kyoto Univ.) / Akisato Kimura(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Well-being Information Technology / Technical Committee on Speech / * / Technical Committee on Pattern Recognition and Media Understanding
本文の言語 JPN
タイトル(和) 空気/体内伝導マイクを併用した雑音環境下における非可聴つぶやき強調法とその評価
サブタイトル(和)
タイトル(英) Non-Audible Murmur Enhancement Method using Air- and Body-Conductive Microphones in Noisy Environments and its Evaluation
サブタイトル(和)
キーワード(1)(和/英) サイレント音声コミュニケーション / silent speech communication
キーワード(2)(和/英) 非可聴つぶやき / Non-Audible Murmur
キーワード(3)(和/英) 統計的声質変換 / statistical voice conversion
キーワード(4)(和/英) 空気/体内伝導音声信号 / air- and body-conducted speech signal
キーワード(5)(和/英) ロンバード効果 / Lombard effect
第 1 著者 氏名(和/英) 田尻 祐介 / Yusuke Tajiri
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学(略称:奈良先端大)
Nara Institute of Science and Technology(略称:NAIST)
第 2 著者 氏名(和/英) 田中 宏 / Kou Tanaka
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学(略称:奈良先端大)
Nara Institute of Science and Technology(略称:NAIST)
第 3 著者 氏名(和/英) 戸田 智基 / Tomoki Toda
第 3 著者 所属(和/英) 奈良先端科学技術大学院大学(略称:奈良先端大)
Nara Institute of Science and Technology(略称:NAIST)
第 4 著者 氏名(和/英) グラム ニュービッグ / Graham Neubig
第 4 著者 所属(和/英) 奈良先端科学技術大学院大学(略称:奈良先端大)
Nara Institute of Science and Technology(略称:NAIST)
第 5 著者 氏名(和/英) サクリアニ サクティ / Sakriani Sakti
第 5 著者 所属(和/英) 奈良先端科学技術大学院大学(略称:奈良先端大)
Nara Institute of Science and Technology(略称:NAIST)
第 6 著者 氏名(和/英) 中村 哲 / Satoshi Nakamura
第 6 著者 所属(和/英) 奈良先端科学技術大学院大学(略称:奈良先端大)
Nara Institute of Science and Technology(略称:NAIST)
発表年月日 2015-06-18
資料番号 PRMU2015-42,SP2015-11,WIT2015-11
巻番号(vol) vol.115
号番号(no) PRMU-98,SP-99,WIT-100
ページ範囲 pp.59-64(PRMU), pp.59-64(SP), pp.59-64(WIT),
ページ数 6
発行日 2015-06-11 (PRMU, SP, WIT)