AI人工智能|腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域( 三 )


本文在多个学术数据集上证明了基于辅助约束的特征解耦方法在活体任务上的有效性 。

AI人工智能|腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域
本文插图

06
SSCGAN:基于风格跳跃连接的人脸属性编辑
SSCGAN:
Facial Attribute Editing via Style Skip Connections
现有的人脸属性编辑方法通常采用编码器-解码器结构 , 其中属性信息被表达成一个one-hot向量然后与图像或特征层拼接起来 。 然而 , 这样的操作只学到了局部的语义映射而忽略了全局的人脸统计信息 。 我们在本文提出通过修改通道层面的全局信息(风格特征)来解决这个问题 。 我们设计了一个基于风格跳跃连接的生成对抗网络(SSCGAN)来实现精准的人脸属性操纵 。 具体来说 , 我们在编码器和解码器之间的多个风格跳跃连接路径上注入目标属性信息 。 每个连接会抽取编码器中的隐藏层的风格特征,然后做一个基于残差的映射函数来将这个风格特征迁移到目标属性的空间 。 接下来 , 这个被调整过的风格特征可以用作输入来对解码器的隐藏层特征做实例归一化 。 此外 , 为了避免空间信息的损失(比如头发纹理或瞳孔位置) , 我们进一步引入了基于跳跃连接的空间信息传递模块 。 通过对全局风格和局部空间信息的操纵 , 本文提出的方法可以得到在属性生成准确率和图像质量上都更好的结果 。 实验结果表明本文的算法和现有的所有方法相比都有优越性 。

AI人工智能|腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域
本文插图

07
基于时序性差异表征的动作识别
TemporalDistinctRepresentationLearning
forActionRecognition
2D卷积神经网络已经广泛应用于图像识别当中并取得成功 , 研究人员现在在尝试利用2D卷积神经网络来对视频进行建模 。 然而利用2D卷积的局限性在于视频的不同帧共享参数 , 会导致重复、冗余的信息提取 , 尤其是空间语义层面会忽略帧间的重要变化 。 在这篇工作中 , 我们尝试通过两种方式来解决这一问题:
一是设计了一种通道层面的序列化注意力机制PEM来逐步地激活特征中有区分性的通道 , 从而避免信息的重复提取;
二是设计了一种时序多样性损失函数(TD Loss)来强制卷积核关注并捕捉帧间的变化而不是表观相似的区域 。
在时序性较强的数据集something-something V1和V2上 , 我们的方法取得了SOTA效果;另外在时序性较弱但规模较大的Kinetics数据集上 , 我们的方法也取得了可观的精度提升 。
结构示意图:

AI人工智能|腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域
本文插图

效果示意图:

AI人工智能|腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域
本文插图

08
物体检测中检测框学习的深入优化
Dive Deeper Into Box for Object Detection
无锚框检测模型现已成为具有最高检测水准的最新方法 , 归因于准确的边界框估计 。 然而无锚框检测在边界定位上还有不足 , 对于具有最高置信度的边界框仍有很大的改进空间 。 在这项工作中 , 我们采用了一种边界重排序的边界框重组策略 , 使得在训练中能够产生更优的边界框 ,从而对物体有更好的贴合 。 此外 , 我们观察到现有方法在边界框分类与位置回归学习中存在语义不一致性 , 所以我们对训练过程中分类与回归目标进行了筛选 , 从而给出了语义一致性的学习目标 。 实验证明我们的优化方法上对于检测性能的提升十分有效 。

AI人工智能|腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域
本文插图



推荐阅读