講演名 2013-11-19
無意味3連音節を用いた音素別明瞭度における話者映像の寄与の分析(「マルチモーダル」,「感性情報処理」,「視知覚とその応用」及びヒューマン情報処理一般)
長谷川 玄, 坂本 修一, 阿部 享, 大谷 智子, 鈴木 陽一, 川瀬 哲明,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,音声の聴き取りにおいて視覚情報,すなわち,口周辺のどの情報が読唇効果に寄与するかを音素ごとに調べるため,全ての母音と全ての子音の組をバランスよく作成した無意味3連音節を様々に加工した顔映像と組み合わせて提示した条件で明瞭度試験を行い,各音素に対する明瞭度から音素ごとの特徴を調べた.その結果, /t/, /n/, /h/, /m/, /w/, /d/, /b/, /p/らの音素は,視覚的影響を受ける音素であることが示された.一方で,映像条件間の正答率に着目すると,話者の顔映像を呈示した条件と口唇のみを呈示した条件に有意な差は見られなかった.これは,口唇のみを呈示していれば,聴き取りの貢献には充分であることを示唆している.しかし,顔の口唇と周辺部分をマスクし,その周りを呈示する映像を呈示する条件でも正答率が有意に上昇しており,口唇以外にも聴き取りに寄与するなんらかの情報が含まれていることが示唆された.
抄録(英) This study focuses on which detailed parts around the speaker's mouse contribute speech intelligibility. To examine this, nonsense tri-syllables speeches were combined with several kinds of speaker's video including the original face and those with and without the mouse to measure audio-visual speech intelligibility. The results showed that intelligibility scores of several phonemes (/n/, /h/, /m/, /w/, /d/, /b/, /p/) were increased by adding visual information. However, there was no significant difference between the score with original speaker's face video and that obtained by the stimuli with only mouse part. It suggests that only the mouse provides sufficient information for speech intelligibility. Moreover, no significance was also observed between the original audio-visual stimuli and those with speakers face without the mouse. It suggests that the visual information around mouse also provide important information for speech intelligibility.
キーワード(和) 音素 / 口唇 / 先行母音 / 読唇
キーワード(英) phoneme / lips / preceding vowel / lip-reading
資料番号 HIP2013-60
発行日

研究会情報
研究会 HIP
開催期間 2013/11/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Human Information Processing (HIP)
本文の言語 JPN
タイトル(和) 無意味3連音節を用いた音素別明瞭度における話者映像の寄与の分析(「マルチモーダル」,「感性情報処理」,「視知覚とその応用」及びヒューマン情報処理一般)
サブタイトル(和)
タイトル(英) Analysis of contribution of a speaker on a monitor screen in the speech intelligibility test by phoneme using meaningless try-syllable
サブタイトル(和)
キーワード(1)(和/英) 音素 / phoneme
キーワード(2)(和/英) 口唇 / lips
キーワード(3)(和/英) 先行母音 / preceding vowel
キーワード(4)(和/英) 読唇 / lip-reading
第 1 著者 氏名(和/英) 長谷川 玄 / Gen HASEGAWA
第 1 著者 所属(和/英) 東北大学電気通信研究所:東北大学大学院情報科学研究科
Research Institute of Electrical Communication, Tohoku University
第 2 著者 氏名(和/英) 坂本 修一 / Shuichi SAKAMOTO
第 2 著者 所属(和/英) 東北大学電気通信研究所:東北大学大学院情報科学研究科
Research Institute of Electrical Communication, Tohoku University
第 3 著者 氏名(和/英) 阿部 享 / Toru ABE
第 3 著者 所属(和/英) 東北大学サイバーサイエンスセンター情報通信基盤研究部
Cyberscience Center, Research Division on Communication Infrastructures, Tohoku University
第 4 著者 氏名(和/英) 大谷 智子 / Tomoko OHTANI
第 4 著者 所属(和/英) 東北大学電気通信研究所:東北大学大学院情報科学研究科
Research Institute of Electrical Communication, Tohoku University
第 5 著者 氏名(和/英) 鈴木 陽一 / Yoiti SUZUKI
第 5 著者 所属(和/英) 東北大学電気通信研究所:東北大学大学院情報科学研究科
Research Institute of Electrical Communication, Tohoku University
第 6 著者 氏名(和/英) 川瀬 哲明 / Tetsuaki KAWASE
第 6 著者 所属(和/英) 東北大学大学院医工学研究科:東北大学大学院医学系研究科
Graduate Scool of Biomedical Engineering, Tohoku University
発表年月日 2013-11-19
資料番号 HIP2013-60
巻番号(vol) vol.113
号番号(no) 299
ページ範囲 pp.-
ページ数 6
発行日