講演名 2018-03-19
SSSD:スマートデバイスを用いた読唇技術向け日本語データベース
齊藤 剛史(九工大), 窪川 美智子(九工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 従来の読唇技術で利用可能なデータベースは,三脚などで固定されたビデオカメラを用いて,光源や背景など整備された環境で撮影された発話シーンである.一方,読唇技術はスマートフォンやタブレットなどのスマートデバイスでの利用が期待されている.そのため,これのデバイスで撮影された発話シーンを収集して利用することは,読唇技術の実利用のためには重要なことである.そこで本論文では,スマートデバイスで撮影された日本語単語発話シーンを収集し,読唇技術向けの日本語データベースSSSDを構築する.本論文では,データベースの構築およびデータベースの性質,ベースライン手法による認識精度を示す.
抄録(英) Speech scenes of conventional database available for lip reading or visual speech recognition (VSR), were record with a video camera fixed on a tripod in a well-maintained environment. On the other hand, VSR is expected to be used in smart devices such as smartphone and tablet as an interface. Therefore, collecting the speech scenes recorded with these devices is an important task for practical use of VSR. In this paper, we collect word utterance scenes taken with smart device, and build a new publicly available database named SSSD for VSR. Moreover, we apply the existing method to our database and show baseline recognition accuracy.
キーワード(和) 読唇技術 / データベース / スマートデバイス
キーワード(英) Lip reading / database / smart device
資料番号 BioX2017-63,PRMU2017-199
発行日 2018-03-11 (BioX, PRMU)

研究会情報
研究会 PRMU / BioX
開催期間 2018/3/18(から2日開催)
開催地(和) 青山学院大学 青山キャンパス
開催地(英)
テーマ(和) オープンイノベーション
テーマ(英)
委員長氏名(和) 佐藤 真一(NII) / 鷲見 和彦(青学大)
委員長氏名(英) Shinichi Sato(NII) / Kazuhiko Sumi(AGU)
副委員長氏名(和) 藤吉 弘亘(中部大) / 井尻 善久(オムロン) / 高野 博史(富山県立大) / 今岡 仁(NEC)
副委員長氏名(英) Hironobu Fujiyoshi(Chubu Univ.) / Yoshihisa Ijiri(Omron) / Hiroshi Takano(Toyama Pref. Univ.) / Hitoshi Imaoka(NEC)
幹事氏名(和) 大西 正輝(産総研) / 舩冨 卓哉(奈良先端大) / 大木 哲史(静岡大) / 青木 隆浩(富士通研)
幹事氏名(英) Masaki Oonishi(AIST) / Takuya Funatomi(NAIST) / Tetsushi Ohki(Shizuoka Univ.) / Takahiro Aoki(Fujitsu Labs.)
幹事補佐氏名(和) 石井 雅人(NEC) / 菅野 裕介(阪大) / 市野 将嗣(電通大) / 高田 直幸(セコム) / 奥井 宣広(KDDI総合研究所)
幹事補佐氏名(英) Masato Ishii(NEC) / Yusuke Sugano(Osaka Univ.) / Masatsugu Ichino(Univ. of Electro-Comm.) / Naoyuki Takada(Secom) / Norihiro Okui(KDDI Research)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Biometrics
本文の言語 JPN
タイトル(和) SSSD:スマートデバイスを用いた読唇技術向け日本語データベース
サブタイトル(和)
タイトル(英) SSSD: Japanese Speech Scene Database by Smart Device for Visual Speech Recognition
サブタイトル(和)
キーワード(1)(和/英) 読唇技術 / Lip reading
キーワード(2)(和/英) データベース / database
キーワード(3)(和/英) スマートデバイス / smart device
第 1 著者 氏名(和/英) 齊藤 剛史 / Takeshi Saitoh
第 1 著者 所属(和/英) 九州工業大学(略称:九工大)
Kyushu Institute of Technology(略称:Kyushu Inst. of Tech.)
第 2 著者 氏名(和/英) 窪川 美智子 / Michiko Kubokawa
第 2 著者 所属(和/英) 九州工業大学(略称:九工大)
Kyushu Institute of Technology(略称:Kyushu Inst. of Tech.)
発表年月日 2018-03-19
資料番号 BioX2017-63,PRMU2017-199
巻番号(vol) vol.117
号番号(no) BioX-513,PRMU-514
ページ範囲 pp.163-168(BioX), pp.163-168(PRMU),
ページ数 6
発行日 2018-03-11 (BioX, PRMU)