講演抄録/キーワード |
講演名 |
2016-05-19 15:10
顔特徴量を用いたテキストからのフォトリアリスティック顔動画像生成の検討 ○佐藤一樹・能勢 隆・伊藤彰則(東北大) IT2016-8 EMM2016-8 |
抄録 |
(和) |
本稿では,フォトリアリスティックな対話エージェント実現に向けた顔動画像合成の手法として,Kinectによる顔特徴量を利用した隠れマルコフモデル (Hidden Markov Model, HMM) に基づく顔動画像合成手法を提案する.近年,対話型エージェントのようにコンピュータと人間が対話する機会が増えつつあり,より人間らしく受け答えのできるエージェントが今後望まれると考えられる.そのために本研究ではエージェントの人間らしさとしてその見た目に着目し,発話内容に同期したフォトリアリスティックな顔動画像の合成を目指す.従来法では HMM 音声合成の枠組みを顔動画像合成に適用する手法が提案されており,合成された顔動画像の品質や学習に用いるデータ作成のコストが高いといった問題点がある.そこで提案法では,Kinect を用いることで取得できる顔の各部位の状態を表した Animation Unit (AU) を特徴量とし,HMM 顔画像合成で得られた顔特徴量を Deep Neural Network (DNN) を用いて輝度値系列へと変換することで顔画像合成を行う.本稿では提案法における HMM,DNN でのパラメータ生成性能について評価を行って最適な学習条件について検討したのち,合成した顔動画像系列を示す. |
(英) |
In this paper, we propose face moving image synthesis technique based on Hidden Markov model (HMM) using the facial features as a method of face moving image synthesis for the photo-realistic interactive agent implementation. In recent years, it becomes more and more popular for a human to interact with computers using human-like interfaces, such as an interactive agent. In such a situation, realization of more human-like agent is needed. Therefore, focusing on realization of an agent with human-like appearance, we investigate a synthesis method of photo-realistic face moving image synchronized with the speech contents. The conventional method employs the same framework as the HMM speech synthesis for face motion image synthesis; however, there are problems that high cost of data preparation for learning and low quality of the synthesized facial image. In the proposed method, we use Animation Unit (AU) as feature of face image generation, which can be obtained by Kinect. The AU is parameters that express each part of the face. Using AU, we synthesize the face motion image by converting the face feature generated from the HMM face image synthesizer into intensities of pixels using the Deep Neural Network (DNN). In this paper, we investigate the optimal learning conditions for the HMM an |
キーワード |
(和) |
顔画像合成 / フォトリアリスティック / HMM / DNN / Kinect / / / |
(英) |
face image synthesis / photo-realistic / HMM / DNN / Kinect / / / |
文献情報 |
信学技報, vol. 116, no. 34, EMM2016-8, pp. 43-48, 2016年5月. |
資料番号 |
EMM2016-8 |
発行日 |
2016-05-12 (IT, EMM) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IT2016-8 EMM2016-8 |
研究会情報 |
研究会 |
IT EMM |
開催期間 |
2016-05-19 - 2016-05-20 |
開催地(和) |
小樽経済センター |
開催地(英) |
Otaru Economic Center |
テーマ(和) |
情報セキュリティ,情報理論,情報ハイディング,一般 |
テーマ(英) |
Information Security, Information Theory, Information Hiding, etc. |
講演論文情報の詳細 |
申込み研究会 |
EMM |
会議コード |
2016-05-IT-EMM |
本文の言語 |
日本語 |
タイトル(和) |
顔特徴量を用いたテキストからのフォトリアリスティック顔動画像生成の検討 |
サブタイトル(和) |
|
タイトル(英) |
Study of Photo-realistic Face Moving Image Generation from the Text Using the Facial Feature |
サブタイトル(英) |
|
キーワード(1)(和/英) |
顔画像合成 / face image synthesis |
キーワード(2)(和/英) |
フォトリアリスティック / photo-realistic |
キーワード(3)(和/英) |
HMM / HMM |
キーワード(4)(和/英) |
DNN / DNN |
キーワード(5)(和/英) |
Kinect / Kinect |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
佐藤 一樹 / Kazuki Sato / サトウ カズキ |
第1著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.) |
第2著者 氏名(和/英/ヨミ) |
能勢 隆 / Takashi Nose / ノセ タカシ |
第2著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.) |
第3著者 氏名(和/英/ヨミ) |
伊藤 彰則 / Akinori Ito / イトウ アキノリ |
第3著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2016-05-19 15:10:00 |
発表時間 |
25分 |
申込先研究会 |
EMM |
資料番号 |
IT2016-8, EMM2016-8 |
巻番号(vol) |
vol.116 |
号番号(no) |
no.33(IT), no.34(EMM) |
ページ範囲 |
pp.43-48 |
ページ数 |
6 |
発行日 |
2016-05-12 (IT, EMM) |
|