講演名 | 2007/11/29 単語知覚における話者映像と時間伸長音声のずれの検知限および許容限 沼畑 俊, 坂本 修一, 田中 章浩, 今井 篤, 都木 徹, 鈴木 陽一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | テレビ放送等の音声と映像が同時に提示されるメディアに話速変換を適用する際音声のみを遅くすると,映像との非同期が生じ,話者の口形情報がうまく利用できなくなる可能性がある.そこで本研究では,単語刺激を用いて話者映像と時間伸長音声により生じるずれの検知限,許容限を測定し,了解度との関係性を検討した.加えて,通常速度の音声と映像を時間的に非同期にした条件でも同様の実験を行った.その結果,伸長条件では,非同期条件に比べ,知覚上ずれに敏感ではないこと,モーラ数が異なることでずれの検知限,許容限が変化し,さらには了解度に検知限,許容限が及ぼす影響も変化することが示された. |
抄録(英) | Speech-rate conversion techniques are useful to support speech recognition, especially for aged person. However, if only the speech-rate is converted, there arises asynchrony between the auditory and visual information. In this study, we investigated the effect of detection/tolerance thresholds of audio-visual asynchrony between time-expanded speech and talker's moving face in spoken word recognition. In the experiment, words were presented under following two conditions : (1) asynchrony by time-expanded speech and (2) simple timing shift. The results showed that detection/tolerance thresholds were greater in asynchrony condition than that in timing shift. Moreover the effect of these thresholds to word recognition decreased while shortening the length of word. |
キーワード(和) | 話速変換 / 時間伸長音声 / 話者映像 / ずれ知覚 / 検知限 / 許容限 |
キーワード(英) | speech-rate conversion / time-expanded speech / talker's moving face / asynchrony perception / detection threshold / tolerance threshold |
資料番号 | HIP2007-139 |
発行日 |
研究会情報 | |
研究会 | HIP |
---|---|
開催期間 | 2007/11/29(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Human Information Processing (HIP) |
---|---|
本文の言語 | JPN |
タイトル(和) | 単語知覚における話者映像と時間伸長音声のずれの検知限および許容限 |
サブタイトル(和) | |
タイトル(英) | Detection/tolerance thresholds of audio-visual asynchrony between time-expanded speech and talker's moving face in spoken word recognition |
サブタイトル(和) | |
キーワード(1)(和/英) | 話速変換 / speech-rate conversion |
キーワード(2)(和/英) | 時間伸長音声 / time-expanded speech |
キーワード(3)(和/英) | 話者映像 / talker's moving face |
キーワード(4)(和/英) | ずれ知覚 / asynchrony perception |
キーワード(5)(和/英) | 検知限 / detection threshold |
キーワード(6)(和/英) | 許容限 / tolerance threshold |
第 1 著者 氏名(和/英) | 沼畑 俊 / Shun NUMAHATA |
第 1 著者 所属(和/英) | 東北大学電気通信研究所 大学院情報科学研究科 Research Institute of Electrical Communication and Graduate School of Information Sciences |
第 2 著者 氏名(和/英) | 坂本 修一 / Shuichi SAKAMOTO |
第 2 著者 所属(和/英) | 東北大学電気通信研究所 大学院情報科学研究科 Research Institute of Electrical Communication and Graduate School of Information Sciences |
第 3 著者 氏名(和/英) | 田中 章浩 / Akihiro TANAKA |
第 3 著者 所属(和/英) | 東京大学大学院人文社会系研究科心理学研究室 Department of Psychology, University of Tokyo |
第 4 著者 氏名(和/英) | 今井 篤 / Atsushi IMAI |
第 4 著者 所属(和/英) | NHK放送技術研究所 NHK Science and Technical Research Laboratories |
第 5 著者 氏名(和/英) | 都木 徹 / Tohru TAKAGI |
第 5 著者 所属(和/英) | NHK放送技術研究所 NHK Science and Technical Research Laboratories |
第 6 著者 氏名(和/英) | 鈴木 陽一 / Yo-iti SUZUKI |
第 6 著者 所属(和/英) | 東北大学電気通信研究所 大学院情報科学研究科 Research Institute of Electrical Communication and Graduate School of Information Sciences |
発表年月日 | 2007/11/29 |
資料番号 | HIP2007-139 |
巻番号(vol) | vol.107 |
号番号(no) | 369 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |