講演名 2018-03-13
話速変換会話における音声への映像同期の効果
小山内 一樹(東京電機大), 徳永 弘子(東京電機大), 武川 直樹(東京電機大), 斎藤 博人(東京電機大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 話速変換とは,音声の高さを保ったまま速度を変える技術である.この技術を,コミュニケーション支援を目的に,遠隔地間の映像会話に適用したものが話速変換会話システムである.これまでの話速変換会話システムでは,音声はゆっくりに変換されるが,映像はリアルタイムに伝送していた.その結果,話し手の視線行動等の発話に付随する非言語行動が音声と同期しなくなり,聞き手が受ける次話者指定の強度が低下し,順番交替のしにくさがあった.本稿では,話速変換音声に映像を同期する映像会話システムを構築し,映像同期・非同期の条件間で,話し手に宛先指定された聞き手側の反応潜時を計測し比較をした.その結果をもとに,映像同期で会話がしやすくなったのか議論する.
抄録(英) Speech rate conversion (SRC) is a technology that converts playback speed of speeches while maintaining their vocal pitches. As an application of SRC, we develop visual-mediated SRC conversation system for supporting aurally impaired. In our previous studies, we have assumed that real-time video transmission is useful to share current situations of participants in conversation,even though voice and video are asynchronously conveyed. However, in the system speaker gaze information addressing next speaker may be erroneously recognized by hearers. In this study, we implemented a video conversation system that synchronizes video with SRC voice, then, performed experimental 3-party conversations. From the video recorded conversations we measured response latency and discuss the effects of video-to-audio synchronized conversations.
キーワード(和) 話速変換 / 音声映像同期 / 次話者指定 / 3人会話
キーワード(英) speech rate conversion / audio-video synchronization / speaker's addressing / three party conversations
資料番号 HCS2017-105
発行日 2018-03-06 (HCS)

研究会情報
研究会 HCS
開催期間 2018/3/13(から2日開催)
開催地(和) 東北大学電気通信研究所 本館(片平キャンパス内)
開催地(英) Research Institute of Electrical Communication, Tohoku University
テーマ(和) 豊かなコミュニケーションを実現する理論と技術および一般
テーマ(英)
委員長氏名(和) 中野 有紀子(成蹊大)
委員長氏名(英) Yukiko Nakano(Seikei Univ.)
副委員長氏名(和) 渡邊 伸行(金沢工大) / 井上 智雄(筑波大)
副委員長氏名(英) Nobuyuki Watanabe(Kanazawa Inst. of Tech.) / Tomoo Inoue(Univ. of Tsukuba)
幹事氏名(和) 林 勇吾(立命館大) / 小森 政嗣(阪電通大) / 吉田 悠(NEC)
幹事氏名(英) Yugo Hayashi(Ritsumeikan Univ.) / Masashi Komori(Osaka Electro-Comm. Univ.) / Haruka Yoshida(NEC)
幹事補佐氏名(和) 高嶋 和毅(東北大) / 藤原 健(阪経済大) / 寺田 和憲(岐阜大) / 木村 敦(日大)
幹事補佐氏名(英) Kazuki Takashima(Tohoku Univ.) / Ken Fujiwara(Osaka Univ. of Economic) / Kazunori Terada(Gifu Univ.) / Atsushi Kimura(Nihon Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Human Communication Science
本文の言語 JPN
タイトル(和) 話速変換会話における音声への映像同期の効果
サブタイトル(和)
タイトル(英) Effect of video-to-audio synchronization in real-time speech rate converted conversations
サブタイトル(和)
キーワード(1)(和/英) 話速変換 / speech rate conversion
キーワード(2)(和/英) 音声映像同期 / audio-video synchronization
キーワード(3)(和/英) 次話者指定 / speaker's addressing
キーワード(4)(和/英) 3人会話 / three party conversations
第 1 著者 氏名(和/英) 小山内 一樹 / Kazuki Osanai
第 1 著者 所属(和/英) 東京電機大学(略称:東京電機大)
Tokyo Denki University(略称:Tokyo Denki Univ.)
第 2 著者 氏名(和/英) 徳永 弘子 / Hiroko Tokunaga
第 2 著者 所属(和/英) 東京電機大学(略称:東京電機大)
Tokyo Denki University(略称:Tokyo Denki Univ.)
第 3 著者 氏名(和/英) 武川 直樹 / Naoki Mukawa
第 3 著者 所属(和/英) 東京電機大学(略称:東京電機大)
Tokyo Denki University(略称:Tokyo Denki Univ.)
第 4 著者 氏名(和/英) 斎藤 博人 / Hiroto Saito
第 4 著者 所属(和/英) 東京電機大学(略称:東京電機大)
Tokyo Denki University(略称:Tokyo Denki Univ.)
発表年月日 2018-03-13
資料番号 HCS2017-105
巻番号(vol) vol.117
号番号(no) HCS-509
ページ範囲 pp.71-76(HCS),
ページ数 6
発行日 2018-03-06 (HCS)