講演名 2011-10-07
音声/非音声区間切替による背景音抑圧処理法の検討(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
小森 智康, 今井 篤, 清山 信正, 田高 礼子, 今井 亨, 本間 真一, 都木 徹,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 高齢者にとって,放送番組のナレーションが背景音(BGM:Background Musicや効果音)の影響で聞き取りにくい場合がある,そのため,NHKでは放送番組のナレーションやセリフを高齢者にも聞きやすくするため,受信機側で背景音を抑圧する手法の研究を進めている.今回,音声と非音声区間推定を利用して,区間毎に背景音の抑圧処理を変える手法を考案した.音素認識の尤度等を利用する提案区間推定法では正解区間との適合率・再現率共に87%以上の高い推定精度を得た,さらに,音声と非音声区間で異なる抑圧処理をした音源の評価実験を若年者5名で実施した.その結果,元の番組音声と抑圧処理した音源との主観評価による比較では,90%以上の比率で背景音が小さくなったと判断され,考案した背景音抑圧処理の有効性を確認できたので報告する.
抄録(英)
キーワード(和) 高齢者 / 音素認識 / ラウドネス / ステレオ相関 / 主観評価
キーワード(英)
資料番号 SP2011-66,WIT2011-48
発行日

研究会情報
研究会 WIT
開催期間 2011/9/29(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Well-being Information Technology(WIT)
本文の言語 JPN
タイトル(和) 音声/非音声区間切替による背景音抑圧処理法の検討(オーガナイズドセッション「人にやさしい音声情報処理」,福祉と音声処理,一般)
サブタイトル(和)
タイトル(英) A Study on Switch Method to Suppress the Background Sound using Speech Segments Detection
サブタイトル(和)
キーワード(1)(和/英) 高齢者
キーワード(2)(和/英) 音素認識
キーワード(3)(和/英) ラウドネス
キーワード(4)(和/英) ステレオ相関
キーワード(5)(和/英) 主観評価
第 1 著者 氏名(和/英) 小森 智康 / Tomoyasu KOMORI
第 1 著者 所属(和/英) NHKエンジニアリングサービス
NHK Engineering Service, INC
第 2 著者 氏名(和/英) 今井 篤 / Atsushi IMAI
第 2 著者 所属(和/英) NHK放送技術研究所
NHK Science and Technical Research Laboratories
第 3 著者 氏名(和/英) 清山 信正 / Nobumasa SEIYAMA
第 3 著者 所属(和/英) NHK放送技術研究所
NHK Science and Technical Research Laboratories
第 4 著者 氏名(和/英) 田高 礼子 / Reiko TAKOU
第 4 著者 所属(和/英) NHK放送技術研究所
NHK Science and Technical Research Laboratories
第 5 著者 氏名(和/英) 今井 亨 / Toru IMAI
第 5 著者 所属(和/英) NHK放送技術研究所
NHK Science and Technical Research Laboratories
第 6 著者 氏名(和/英) 本間 真一 / Shinichi HOMMA
第 6 著者 所属(和/英) NHK放送技術研究所
NHK Science and Technical Research Laboratories
第 7 著者 氏名(和/英) 都木 徹 / Tohru TAKAGI
第 7 著者 所属(和/英) NHKエンジニアリングサービス
NHK Engineering Service, INC
発表年月日 2011-10-07
資料番号 SP2011-66,WIT2011-48
巻番号(vol) vol.111
号番号(no) 226
ページ範囲 pp.-
ページ数 6
発行日