講演名 2003/1/17
複数人話者会話シーンの動画像翻訳
前島 謙宣, 森島 繁生, 中村 哲,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では、複数人の話者の会話シーンにおける画像翻訳の手法について述べる。会話シーンにおいて、ビデオ映像中の人物の顔の動きを推定し、映像中に存在する各話者について発話判定を行う。発話が検出された話者の口領域を、別に用意された音声に同期して合成された口唇映像で置き換えることにより、他言語もしくは変換された発話内容へのリップシンクを実現する。
抄録(英) In the paper, we describe a technique of a video-sequence translation in two or more speaker's conversation scene. In a conversation scene, a movement of the face of the person in a video-sequence is estimated, and an utterance judging is performed about each speaker who exists in an image. By replacing the mouth part with synthesized image synchronizing with the sound prepared independently, lip-synchronization to other language of the changed contents of utterance is realized.
キーワード(和) 自動顔トラッキング / 発話検出 / リップシンク / 合成動画像
キーワード(英) Automatic Face Tracking / Utterance Judging / Lip-Synchronization / Synthesize Video Animation
資料番号 HCS2002-30
発行日

研究会情報
研究会 HCS
開催期間 2003/1/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Human Communication Science (HCS)
本文の言語 JPN
タイトル(和) 複数人話者会話シーンの動画像翻訳
サブタイトル(和)
タイトル(英) Video Sequence Translation of Multi-Speakers Conversation Scene
サブタイトル(和)
キーワード(1)(和/英) 自動顔トラッキング / Automatic Face Tracking
キーワード(2)(和/英) 発話検出 / Utterance Judging
キーワード(3)(和/英) リップシンク / Lip-Synchronization
キーワード(4)(和/英) 合成動画像 / Synthesize Video Animation
第 1 著者 氏名(和/英) 前島 謙宣 / Akinobu MAEJIMA
第 1 著者 所属(和/英) 成蹊大学工学部
Faculty of Engineering, Seikei University
第 2 著者 氏名(和/英) 森島 繁生 / Shigeo MORISHIMA
第 2 著者 所属(和/英) 成蹊大学工学部
Faculty of Engineering, Seikei University
第 3 著者 氏名(和/英) 中村 哲 / Satoshi NAKAMURA
第 3 著者 所属(和/英) 成蹊大学工学部
Faculty of Engineering, Seikei University
発表年月日 2003/1/17
資料番号 HCS2002-30
巻番号(vol) vol.102
号番号(no) 598
ページ範囲 pp.-
ページ数 6
発行日