講演抄録/キーワード |
講演名 |
2017-05-17 10:20
話速変換会話における映像音声の同期・非同期再生条件の比較検討 ~ 話者が伝える宛先指定の強さは変化するのか ~ ○小山内一樹・徳永弘子・武川直樹・斎藤博人(東京電機大) HCS2017-29 HIP2017-29 |
抄録 |
(和) |
話速変換とは,音声の高さを変えずに速度を変える事が出来る技術である.この話速変換技術の応用としてコミュニケーション支援を目的として映像会話に適用したものが話速変換会話である.これまで開発してきた話速変換会話システムでは,ゆっくり音声と映像に時間差があっても,参与者の現在の映像を伝えることが有効との考えのもと,映像をリアルタイムに伝送していた.その結果,話し手の視線による宛先指定が,発話意図の表出のタイミングと同期しない問題があった.本稿では,話速変換音声に映像が同期する会話システムを構築し,映像同期・非同期の条件間で宛先指定の強さに変化が生ずるのかを実験により検証した結果を報告する. |
(英) |
Speech rate conversion (SRC) is a technology that converts playback speed of speeches while maintaining their vocal pitches. As an application of SRC, we develop video-mediated speech rate converted conversation system for supporting aurally impaired. In our previous studies, we have assumed that real-time video transmission is useful to share current situations of participants in conversation, even though voice and video are asynchronously conveyed. However, in the system speaker gaze information for addressing next speaker may be erroneously recognized by hearers. In this study, we developed a novel speech rate conversation system that synchronize speaker’s voice and video information. Evaluation test results shows that strength of speaker's select-next of synchronous condition was stronger than that of asynchronous condition. |
キーワード |
(和) |
話速変換 / 音声映像同期 / 次話者指定 / 3人会話 / / / / |
(英) |
speech rate conversion / audio-video synchronization / speaker's addressing / three party conversations / / / / |
文献情報 |
信学技報, vol. 117, no. 29, HCS2017-29, pp. 189-194, 2017年5月. |
資料番号 |
HCS2017-29 |
発行日 |
2017-05-09 (HCS, HIP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
HCS2017-29 HIP2017-29 |