AI人工智能|腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域( 二 )



AI人工智能|腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域
本文插图

03
通过分布蒸馏损失改善人脸识别中的困难样本
Improving Face Recognition
from Hard Samples via Distribution Distillation Loss
目前基于深度学习的人脸识别算法已经可以较好的处理简单样本 , 但对于困难样本(低分辨率、大姿态等)仍表现不佳 。 目前主要有两种方式尝试解决这一问题 。 第一种方法是充分利用某种需要处理的人脸畸变的先验信息 , 设计特定的结构或损失函数 。 这种方式通常不能方便地迁移到其他畸变类型 。 第二种方法是通过设计合适的损失函数 , 减小类内距离 , 增大类间距离 , 得到更具辨别能力的人脸特征 。 这种方式一般在简单和困难样本上存在明显的性能差异 。 为了提升人脸识别模型在困难样本上的性能 , 我们提出了一种基于分布蒸馏的损失函数 。 具体来说 , 我们首先通过一个预训练的识别模型构造两种相似度分布(从简单样本构造的Teacher分布和从困难样本的Student分布) , 然后通过分布蒸馏损失函数使Student分布靠近Teacher分布 , 从而减小Student分布中的同人样本和非同人样本的相似度重合区域 , 提高困难样本的识别性能 。 我们在常用的大规模人脸测试集和多个包含不同畸变类型(人种、分辨率、姿态)的人脸测试集上进行了充分的实验 , 验证了方法的有效性 。

AI人工智能|腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域
本文插图

04
基于对抗语义数据增强的人体姿态估计
AdversarialSemanticDataAugmentation
forHumanPoseEstimation
人体姿态估计主要目的是定位人体的关键点坐标 。 目前的SOTA方法在严重遮挡、旁人干扰、对称相似三种困难场景中表现仍有待提升 。 一个主要的原因是这三种困难场景的训练数据较少 。 之前的方法主要是利用scale、rotation、translation等global spatial transform的方法去进行训练数据增强 。 这类常规的数据增强方法并不能对上述三种困难场景有提升和帮助 。 本文提出了一种Adversarial Semantic Data Augmentation(对抗语义数据增强方法) 。 该方法把人体分成多个有语义的部件 , 并对这些人体部件在不同的细粒度上进行重组 , 从而去模拟出上述三种困难场景 。 在重组人体部件的过程中 , 有多个空间变换参数来调节每一个人体部件 , 从而灵活的组合旁人遮挡、手臂交叉、复杂动作等情况 。 为了让人体姿态估计网络能更好的学习到对这些困难场景的鲁棒性 , 我们设计了另外一个生成网络(G)用于控制每个人体部件的空间变换参数 , 人体姿态估计网络作为判别网络(D)从G生成的困难样本里面去学习 。 G和D在训练过程中互相对抗 。 G网络不断的生成各种困难样本 , 以迷惑人体姿态估计网络 。 而人体姿态估计网络从这个对抗过程中也不断提升了自己对困难场景的预测准确性 。
05
基于特征解耦的人脸活体检测
FaceAnti-Spoofingvia
Disentangled Representation Learning
活体检测技术用于在身份验证场景中确定对象是否为真人 , 以防御照片、面具、屏幕翻拍等多种方式的攻击 , 保证人脸识别安全 。 目前基于RGB图像的活体检测方法往往从图片中直接提取判别性特征 , 但该特征可能包含了光照、背景或ID等与活体任务无关的信息 , 影响方法实际使用的泛化性 。 针对泛化性问题 , 本文从特征解耦角度出发 , 提出以下创新点:
1、设计解耦框架将图片特征解耦成活体相关特征和活体无关特征两部分 , 并利用活体相关特征进行真假判别 。
2、结合底层纹理特征约束和高层深度特征约束 , 进一步促进活体特征的解耦 。
3、探索并展示了影响活体特征的因素 , 例如攻击介质、采集设备等 , 进一步深入理解活体任务本质 。


推荐阅读