開催案内

第9回バイオメトリクスと認識・認証シンポジウム in 東京 12月5日〜6日

<お知らせ> SBRA2019のホームページを立ち上げました!

SBRA2019へようこそ!

バイオメトリクス(生体計測やそれに類するセンサ情報)、認証・認識は、センサ・アルゴリズム、実装、システム構築からサービスまでの複合的研究分野であるとともに、本人認証、個人識別、認識という安全安心社会のインフラストラクチャーであり、かつ、プライバシーや個人情報にかかわるクリティカルな側面を持つ、非常に複雑な様相を持ったシステムです。このような背景のものと、「バイオメオトリクスと認識・認証シンポジウム(SBRA)」は、バイオメトリクスや認識・認証に関する様々な領域の研究者・開発者・利用者が一堂に会し、交流、情報交換、相互啓発を広げていくための場として位置付けられています。第9回目となるSBRA2019ではバイオメトリクスおよび認識・認証に関連する幅広い研究・開発・社会的用テーマを設定し、それらの一層の融合と拡充を進めていきます。

日時

2019年12月5日(木)〜6日(金)

懇親会

12月5日(木)夕刻を予定(詳細は決まり次第ご案内します)

会場

東京工業大学大岡山キャンパス ディジタル多目的ホール
会場へのアクセスは,こちらをご参照ください.

締切

参加登録料

※ 参加申込のキャンセルは,事前参加登録締切日までとします.
※ 事前登録を行ったにも関わらず,当日不参加の場合は,後日,参加登録料を振り込んでいただきます.
※ 参加登録料は当日受付にて現金でお支払いください(その場で領収書を発行させていただきます).

主催

電子情報通信学会 バイオメトリクス研究専門委員会 (BioX)

協賛

IEEE Signal Processing Society Tokyo Joint Chapter 一般社団法人 電子情報通信学会 情報論的学習理論と機械学習研究専門委員会(IBISML)
一般社団法人 電子情報通信学会 情報セキュリティ研究専門委員会 (ISEC)
一般社団法人 電子情報通信学会 信号処理研究専門委員会 (SIP)
一般社団法人 電子情報通信学会 音声研究専門委員会 (SP)/一般社団法人 日本音響学会 音声研究委員会 (SP)
一般社団法人 電子情報通信学会 パターン認識・メディア理解研究専門委員会 (PRMU)
一般社団法人 情報処理学会 コンピュータビジョンとイメージメディア研究会 (CVIM)
一般社団法人 情報処理学会 コンピュータセキュリティ研究会 (CSEC)
一般社団法人 情報処理学会 音声言語情報処理研究会 (SLP)
一般社団法人 日本自動認識システム協会 (JAISA)
一般財団法人 ニューメディア開発協会
一般社団法人 日本光学会情報フォトニクス研究グループ

基調講演

Beyond Pattern Recognition: New Frontiers for Biometrics

Dr. Arun Ross
ミシガン州立大学

Biometrics is the science of recognizing individuals based on their physical and behavioral attributes such as fingerprints, face, iris, voice and gait. The past decade has witnessed tremendous progress in this field, including the deployment of biometric solutions in diverse applications such as border security, national ID cards, amusement parks, access control, and smartphones. Despite these advancements, biometric systems have to contend with a number of challenges related to data quality, presentation attacks, and personal privacy. For example, a biometric system is vulnerable to “spoof attacks” where an adversary imitates the biometric trait (e.g., fingerprint) of another person. Further, issues related to “information leakage”, where the biometric data of an individual is processed to extract additional information (such as age, gender, race, etc.) beyond what was expressed at the time of data collection, can undermine personal privacy. This talk will highlight some of the recent progress made in the field of biometrics; present our lab’s work on presentation attack detection and privacy impartation to biometric data; and discuss some of the challenges that have to be solved in order to promote the widespread use of this technology.

招待講演

並列した敵対的生成ネットワークを用いた荷物所持状況変化に頑健な歩容による年齢推定

(BTAS2019: Make the Bag Disappear: Carrying Status-invariant Gait-based Human Age Estimation using Parallel Generative Adversarial Networks.)

槇原 靖
国立大学法人大坂大学 高等共創研究院

本研究では,荷物所持状況変化に頑健な歩容による年齢推定手法を提案する.歩行映像解析の分野で広く用いられている見えに基づく歩容特徴は,荷物所持状況変化によって大きな影響を受けるため,年齢推定などのタスクの精度が低下する.そこで,荷物所持による影響を削除して,あたかも荷物を所持していない状態の歩容特徴を敵対的生成ネットワーク (GAN)により生成することで,年齢推定の精度向上を目指す.また,入力として荷物所持・不所持のいずれも場合も考えられることから,荷物所持・不所持に対応した並列したGAN構造を利用した学習を行った.実験では,世界最大規模の歩行映像公開データベースを用いて,提案手法の有効性を確認した.


CNNを用いた肌のマルチスペクトル画像からの個人識別

(CVPR2019: Skin-Based Identification From Multispectral Image Data Using CNN)

上森 丈士
Sony Europe B.V. Germany Branch

顔、虹彩、指紋、静脈などの生体特徴を使ったバイオメトリクスは、スマートフォンにおけるログイン認証をはじめとする様々なアプリケーションで求められている。今回、私たちは肌の小領域画像のみから個人を特定する技術を開発した。個人の肌のスペクトルの微小な差異が、個人を識別する特徴量になり得ることに着目し、CNNを用いてその特徴量を抽出・学習することで、これを可能にした。本技術は、従来の幾何情報を用いたバイオメトリクス方式とは異なり、肌のスペクトル情報を用いるため、手のような無数の形状をとり得るような対象においても適用可能だと考えられる。そこで、本技術をテーブルトップデバイスに適用し、手の肌画像のみから複数のユーザーおよびその両手を識別する実証実験を行ったので、本講演ではその結果について報告する。


ゼロショット学習を用いた一般物体認識

(CVPR2019: On Zero-Shot Recognition of Generic Objects)

Dr. Tristan Erwan Marie Hascoet (トリスタン エワンマリー ハスコエト)
国立大学法人神戸大学 システム情報研究科

10年間における積極的な研究にも関わらず、Imagenetベンチマークにおけるゼロショット学習(ZSL)モデルの精度は低く、未だ一般物体認識アプリケーションでの実用化には至っていません。この論文では、データセットの数々の問題点が、モデル精度の向上の壁となっていることについて言及しました。さらに、構造的バイアスという概念について紹介しました。構造的バイアスとは、ゼロショット学習特有の現象であり、過去のゼロショット学習の進歩は、このバイアスに多くの影響を受けました。上記の問題点の改善を可能とするベンチマークを提案しました。


ゼロショットラーニングを高精度化する要素分解学習技術

(CVPR2019: Hierarchical Disentanglement of Discriminative Latent Features for Zero-Shot Learning)

野中 雄一
株式会社日立製作所 研究開発グループ デジタルテクノロジーイノベーションセンタ

公共エリアでの映像監視支援や産業分野における目視検査代替など、ディープラーニングを用いた画像認識への期待が高まっているが、学習データが事前に入手困難であるケースへの対応が進んでいない。解決方法の一つとして、学習していない未知クラスを認識可能とするゼロショットラーニングがあるが、認識率の高精度化が実適用時の課題となっている。本研究では、対象物の認識に寄与する画像特徴量と、対象物の認識に直接寄与しない画像特徴量を要素分解しながら学習し、前者を選別して認識することで高精度化を行う手法を提案した。本講演では、CVPR2019で発表した上記提案手法について紹介する。


高速な画像検索を実現するハッシングとその応用

(ICIP2019: PDH: Probabilistic deep hashing based on MAP estimation of Hamming distance)

加賀 陽介
株式会社日立製作所 研究開発グループ

Web上の画像の急増に伴い,高速な類似画像検索に対するニーズが高まっている. ハッシングは,画像を短いバイナリコードに変換して照合を行うことで,近似最近傍探索を高速かつ低消費メモリで行う手法であり,その有効性と汎用性から近年活発に研究が行われている.本講演では,ハッシングの手法について概説した後,講演者らが開発したハッシング手法であるPDHについて説明する.PDHでは,画像の確率分布から損失関数を導出し,Deep learningを使ってハッシュ関数を学習する.このハッシュ関数を用いた画像検索が,理想的な距離のMAP推定に基づく検索と等価であることを示す.最後に,ハッシングの生体認証への応用について述べる.


Attention Branch Network:視覚的説明を用いたAttention機構の学習

(CVPR2019: Attention Branch Network: Learning of Attention Mechanism for Visual Explanation)

福井 宏
日本電気株式会社 バイオメトリクス研究所

近年の深層学習の研究では,認識結果に対する判断理由を解析する研究が活発に行われている.中でも,深層学習が注視した領域を可視化する視覚的説明がある.しかし.視覚的説明は深層学習の判断根拠をユーザへ視覚的に伝えることができるが,認識精度向上にはほとんど貢献しない.提案手法のAttention Branch Networkは,視覚的説明のAttention mapをAttention機構に応用することで,認識精度向上と視覚的説明を同時に実現する.また.本手法は画像分類,物体検出,顔属性認識等の様々な画像認識タスクやネットワークモデルへ応用が可能である.


顔属性推定のためのMerged Multi-CNNとそのパラメータ削減手法に関する検討

(ICB2019: Merged Multi-CNN with Parameter Reduction for Face Attribute Estimation)

河合 洋弥
国立大学法人東北大学 大学院情報科学研究科

顔属性推定ではマルチタスクCNNを用いた手法が主流であるが,マルチタスクCNNのネットワーク構造を手動で設計することは困難である.本論文では,Merged Multi-CNN (MM-CNN) を用いた顔属性推定手法を提案する.多数のCNNをMergeレイヤにより統合することで,顔属性推定に適したマルチタスクCNNを自動合成する.また,全結合層の完全除去によるパラメータ削減手法を提案する.CelebAおよびLFW-aの2つのデータセットを用いた性能評価実験を通して,提案手法が従来手法より推定精度とパラメータ効率で優れていることを実証する.


フェイク顔映像の検知と改ざん領域の推定を同時に行うマルチタスク学習

(BTAS2019: Multi-task Learning For Detecting and Segmenting Manipulated Facial Images and Videos)

越前 功
国立情報学研究所 情報社会相関研究系

近年,DeepfakeやFace2Faceを始めとした顔画像を変更または加工するフェイクビデオの流通が社会問題化しており,このようなフェイクビデオを検知する手法の確立が求められている.本講演では,講演者らが提案した顔画像を対象とするフェイクビデオの検知手法に加えて,フェイクビデオの検知と同時に改ざん領域の推定を行う手法について概説する.後者の手法はマルチタスク学習を用いることで,どの手法によってフェイクビデオが生成されたかを推定することが可能になる.さらに,新たな顔画像の変更・加工手法によりフェイクビデオが生成されても,少量のサンプルを用いて学習することで,当該手法に対する高精度の検知が可能なことを示す.


話者照合の生体検知チャレンジ「ASVspoof 2019」の概要と今後の展望

(Interspeech2019: ASVspoof 2019: Future Horizons in Spoofed and Fake Audio Detection)

山岸 純一
国立情報学研究所 コンテンツ科学研究系

話者照合技術はスマートデバイスやコールセンター等にて広く利用されているが、音声技術によるなりすまし攻撃やプレイバック攻撃が行われる事から、他の生体認証と同様、生体検知による防御を行う必要がある。我々は、話者照合の生体検知精度を競うASVspoofチャレンジを2015年以降2年おきに開催している。ASVspoof2019では米国Google, 日本NTTおよびHOYA, 中国iFlytek等の国際企業を巻き込み、ディープラーニングにより生成された非常に高精度ななりすまし音声のDBを構築した。チャレンジの結果からは、聴覚上ほぼ差が無いなりすまし音声でも生体検知にて識別可能であるという結果が得られた。


Speaker Embeddingのための話者性に基づく学習データ拡張

(Interspeech2019: Speaker Augmentation and Bandwidth Extension for Deep Speaker Embedding )

山本 仁
日本電気株式会社 日本電気株式会社

近年の話者照合は、音声の個人性を表す特徴量としてSpeaker Embedding(話者埋め込み表現)を用いる。この特徴量は音声から話者を識別するDNNの中間層の出力として抽出される。DNNの訓練サンプルが多いほど特徴量の精度が良いことから、雑音などを重畳してサンプルを人工的に増やすデータ拡張がよく用いられる。本稿は、従来のような既存話者のサンプルの生成に加え、声質変換により話者性が異なる新しい話者のサンプルを生成するデータ拡張を提案する。DNNに識別させる話者数を増やすことにより特徴量の精緻化を図る。NISTの最新タスクに準じた話者照合評価において、提案法で話者数を3倍にした場合に照合誤りを約18%削減する効果を確認した。