講演名 | 2018-03-13 話速変換会話における音声への映像同期の効果 小山内 一樹(東京電機大), 徳永 弘子(東京電機大), 武川 直樹(東京電機大), 斎藤 博人(東京電機大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 話速変換とは,音声の高さを保ったまま速度を変える技術である.この技術を,コミュニケーション支援を目的に,遠隔地間の映像会話に適用したものが話速変換会話システムである.これまでの話速変換会話システムでは,音声はゆっくりに変換されるが,映像はリアルタイムに伝送していた.その結果,話し手の視線行動等の発話に付随する非言語行動が音声と同期しなくなり,聞き手が受ける次話者指定の強度が低下し,順番交替のしにくさがあった.本稿では,話速変換音声に映像を同期する映像会話システムを構築し,映像同期・非同期の条件間で,話し手に宛先指定された聞き手側の反応潜時を計測し比較をした.その結果をもとに,映像同期で会話がしやすくなったのか議論する. |
抄録(英) | Speech rate conversion (SRC) is a technology that converts playback speed of speeches while maintaining their vocal pitches. As an application of SRC, we develop visual-mediated SRC conversation system for supporting aurally impaired. In our previous studies, we have assumed that real-time video transmission is useful to share current situations of participants in conversation,even though voice and video are asynchronously conveyed. However, in the system speaker gaze information addressing next speaker may be erroneously recognized by hearers. In this study, we implemented a video conversation system that synchronizes video with SRC voice, then, performed experimental 3-party conversations. From the video recorded conversations we measured response latency and discuss the effects of video-to-audio synchronized conversations. |
キーワード(和) | 話速変換 / 音声映像同期 / 次話者指定 / 3人会話 |
キーワード(英) | speech rate conversion / audio-video synchronization / speaker's addressing / three party conversations |
資料番号 | HCS2017-105 |
発行日 | 2018-03-06 (HCS) |
研究会情報 | |
研究会 | HCS |
---|---|
開催期間 | 2018/3/13(から2日開催) |
開催地(和) | 東北大学電気通信研究所 本館(片平キャンパス内) |
開催地(英) | Research Institute of Electrical Communication, Tohoku University |
テーマ(和) | 豊かなコミュニケーションを実現する理論と技術および一般 |
テーマ(英) | |
委員長氏名(和) | 中野 有紀子(成蹊大) |
委員長氏名(英) | Yukiko Nakano(Seikei Univ.) |
副委員長氏名(和) | 渡邊 伸行(金沢工大) / 井上 智雄(筑波大) |
副委員長氏名(英) | Nobuyuki Watanabe(Kanazawa Inst. of Tech.) / Tomoo Inoue(Univ. of Tsukuba) |
幹事氏名(和) | 林 勇吾(立命館大) / 小森 政嗣(阪電通大) / 吉田 悠(NEC) |
幹事氏名(英) | Yugo Hayashi(Ritsumeikan Univ.) / Masashi Komori(Osaka Electro-Comm. Univ.) / Haruka Yoshida(NEC) |
幹事補佐氏名(和) | 高嶋 和毅(東北大) / 藤原 健(阪経済大) / 寺田 和憲(岐阜大) / 木村 敦(日大) |
幹事補佐氏名(英) | Kazuki Takashima(Tohoku Univ.) / Ken Fujiwara(Osaka Univ. of Economic) / Kazunori Terada(Gifu Univ.) / Atsushi Kimura(Nihon Univ.) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Human Communication Science |
---|---|
本文の言語 | JPN |
タイトル(和) | 話速変換会話における音声への映像同期の効果 |
サブタイトル(和) | |
タイトル(英) | Effect of video-to-audio synchronization in real-time speech rate converted conversations |
サブタイトル(和) | |
キーワード(1)(和/英) | 話速変換 / speech rate conversion |
キーワード(2)(和/英) | 音声映像同期 / audio-video synchronization |
キーワード(3)(和/英) | 次話者指定 / speaker's addressing |
キーワード(4)(和/英) | 3人会話 / three party conversations |
第 1 著者 氏名(和/英) | 小山内 一樹 / Kazuki Osanai |
第 1 著者 所属(和/英) | 東京電機大学(略称:東京電機大) Tokyo Denki University(略称:Tokyo Denki Univ.) |
第 2 著者 氏名(和/英) | 徳永 弘子 / Hiroko Tokunaga |
第 2 著者 所属(和/英) | 東京電機大学(略称:東京電機大) Tokyo Denki University(略称:Tokyo Denki Univ.) |
第 3 著者 氏名(和/英) | 武川 直樹 / Naoki Mukawa |
第 3 著者 所属(和/英) | 東京電機大学(略称:東京電機大) Tokyo Denki University(略称:Tokyo Denki Univ.) |
第 4 著者 氏名(和/英) | 斎藤 博人 / Hiroto Saito |
第 4 著者 所属(和/英) | 東京電機大学(略称:東京電機大) Tokyo Denki University(略称:Tokyo Denki Univ.) |
発表年月日 | 2018-03-13 |
資料番号 | HCS2017-105 |
巻番号(vol) | vol.117 |
号番号(no) | HCS-509 |
ページ範囲 | pp.71-76(HCS), |
ページ数 | 6 |
発行日 | 2018-03-06 (HCS) |