お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2015-05-21 15:20
ビデオ通話における音声および表情特徴量を用いた話者変換の検討
齋藤優貴能勢 隆東北大)・篠崎隆宏東工大)・伊藤彰則東北大IT2015-9 EMM2015-9
抄録 (和) 本稿では、ビデオ通話において話者(元話者)の顔画像の個人性を別の話者(目標話者)のものに変換する手法を2つ提案する。
提案法1では、あらかじめ元話者と目標話者の発話を学習データとして用意し、これから音声特徴量と顔画像特徴量を抽出する。この際、顔画像特徴量はピクセルデータに対し主成分分析をして次元圧縮をしたものを使用する。
提案法2では,Kinect v2を用いて目標話者の顔画像の収録を行い、表情特徴量と顔画像特徴量を抽出する。表情特徴量はAnimation Unitパラメータを使用し,顔画像特徴量は提案法1と同様の手法を用いる.
これらの提案法において特徴量をニューラルネットワークで学習し変換を行った.
この結果,提案法1では,顔の概形は変換できたものの口の動きは変換することができなかった.
提案法2では,顔の概形や口の動きが若干変換することができている一方で,顔画像の劣化が大きいという結果となった. 
(英) In this paper, we suggest two method that the individuality of the face of original speaker convert that of target speaker. In the method 1, in advance we prepare the speech data of original and target speaker for learning data, then we extract the audio feature value and face image feature value from it. The face image feature value is the thing that apply principal component analysis to pixel data and reduce dimention.
In the method 2, in advance we record the face image of target speaker, then extract the face expression feature value and face image feature value from it. We use Animation Unit parameter as the face expression feature value, and the face image feature value is the same as the method 1.
In these methods, We used the feature values for neural network learning, and converted feature values using it.
As a result, in the method 1, we could convert general form of the face well, but couldn't convert mouth movement.
In the method 2, we could convert general form of the face and mouth movement in some degree, but the quality of face image was deteriorated.
キーワード (和) 話者変換 / 顔画像変換 / ニューラルネットワーク / 主成分分析 / Kinect v2 / / /  
(英) speaker conversion / face conversion / neural network / principal component analysis / Kinect v2 / / /  
文献情報 信学技報, vol. 115, no. 38, EMM2015-9, pp. 45-50, 2015年5月.
資料番号 EMM2015-9 
発行日 2015-05-14 (IT, EMM) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード IT2015-9 EMM2015-9

研究会情報
研究会 EMM IT  
開催期間 2015-05-21 - 2015-05-22 
開催地(和) 京都市国際交流会館 
開催地(英) Kyoto International Community House 
テーマ(和) 情報セキュリティ,情報理論,情報ハイディング,一般 
テーマ(英) Information Security, Information Theory, Information Hiding, etc. 
講演論文情報の詳細
申込み研究会 EMM 
会議コード 2015-05-EMM-IT 
本文の言語 日本語 
タイトル(和) ビデオ通話における音声および表情特徴量を用いた話者変換の検討 
サブタイトル(和)  
タイトル(英) A study on speaker conversion using speech and expression features for video chatting 
サブタイトル(英)  
キーワード(1)(和/英) 話者変換 / speaker conversion  
キーワード(2)(和/英) 顔画像変換 / face conversion  
キーワード(3)(和/英) ニューラルネットワーク / neural network  
キーワード(4)(和/英) 主成分分析 / principal component analysis  
キーワード(5)(和/英) Kinect v2 / Kinect v2  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 齋藤 優貴 / Yuuki Saito / サイトウ ユウキ
第1著者 所属(和/英) 東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.)
第2著者 氏名(和/英/ヨミ) 能勢 隆 / Takashi Nose / ノセ タカシ
第2著者 所属(和/英) 東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.)
第3著者 氏名(和/英/ヨミ) 篠崎 隆宏 / Takahiro Shinozaki / シノザキ タカヒロ
第3著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Institute of Technology)
第4著者 氏名(和/英/ヨミ) 伊藤 彰則 / Akinori Ito / イトウ アキノリ
第4著者 所属(和/英) 東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2015-05-21 15:20:00 
発表時間 25分 
申込先研究会 EMM 
資料番号 IT2015-9, EMM2015-9 
巻番号(vol) vol.115 
号番号(no) no.37(IT), no.38(EMM) 
ページ範囲 pp.45-50 
ページ数
発行日 2015-05-14 (IT, EMM) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会