计算机视觉工坊人脸识别技术介绍和表情识别最新研究( 三 )


计算机视觉工坊人脸识别技术介绍和表情识别最新研究
本文插图
在该文中 , 由于将面部情感识别视为目标任务 , 因此将情感预测用作辅助任务 , 从而从图像到标签的关系和任务到任务的关系中使目标任务受益 , 该算法如下图所示 。
计算机视觉工坊人脸识别技术介绍和表情识别最新研究
本文插图
文中在两种情况下对该模型进行评估:(1)用于图像分类的合成噪声标签数据集(CIFAR-10 [25]);(2)用于面部表情识别的两个实用的面部表情数据集(RAF和AffectNet) 。
下图为实验1的结果 , 可见采用文中提出的模型使得准确率得到提高 。

计算机视觉工坊人脸识别技术介绍和表情识别最新研究
本文插图
下图为基线和在训练步骤中提出的模型的测试准确性曲线的可视化呈现 。
计算机视觉工坊人脸识别技术介绍和表情识别最新研究
本文插图
下图为实验2的面部情绪数据集的评估结果 , 可知在多任务情况下 , 运用本文提出的模型获得的预测准确性更高 。

计算机视觉工坊人脸识别技术介绍和表情识别最新研究
本文插图
本文介绍了一个带有噪声的多任务注释的面部情绪识别的问题 , 在减少人为多任务学习的标签工作方面具有很大的应用潜力 。 文中从联合分配匹配的角度介绍了一种新的公式 , 按照该公式 , 采用一种新的对抗学习方法来共同优化情绪预测和联合分布学习 。 最后研究了合成噪声标签数据集和实用的噪声多任务数据库的建立 , 并通过对它们的评估证明了该方法在解决新问题方面的明显优势 。
2) THIN: THrowable Information Networks and Application for Facial Expression Recognition In The Wild
摘要
对于使用深度学习技术解决的许多任务 , 可以识别一个外生变量 , 该变量会影响到不同类的外观 , 并且理想分类器能够对此变量始终保持不变 。 本文提出了双重外生/内生表示法 。 文中设计了一个预测层 , 该预测层使用由外生表示条件限定的深度整体 , 可以学习自适应的弱预测变量的权重 , 并且显式地建模外生变量和预测任务之间的依赖关系 。 此外 , 文中提出了外源性消除损失的计算 , 以从内源性表示中删除外源性信息 。 因此 , 外生信息被使用了两次 , 第一次是作为目标任务的条件变量 , 第二次是在内生表示中产生不变性 。 本文将该方法命名为THIN , 代表THrowable Information Net-works 。 本文在几种可以识别外源信息的情况下 , 通过实验验证了THIN , 例如大旋转下的数字识别和多尺度下的形状识别 。 还将其应用于以身份为外生变量的FER 。 特别是证明了THIN在某些具有挑战性的数据集上的性能明显优于最新方法 。
深度学习技术在计算机视觉的监督学习中取得了重大进展 , 允许共同学习一种表示形式和基于这种表示形式的预测变量 。 完善的深度学习技术构成了大多数计算机视觉问题中的最新方法 , 例如对象分类或检测 , 语义分割或面部和身体分析 。 然而 , 在许多此类任务中 , 对象的外观会受到外生变量的严重影响 , 理想情况下 , 任务预测应根据该变量进行不变 。
但是 , 与此同时 , 从预测系统的角度来看 , 无论外在变量(例如受试者身份)的变化如何 , 都应该预测我们的目标任务(例如面部表情) 。 因此 , 本文认为与任务相关的表示(称为内生表示)应包含尽可能少的有关外生变量的信息 。
综上所述 , 在这种情况下 , 该外生变量是数据变化的重要来源 , 同时也是信息的来源 , 从该信息中 , 预测变量的输出应尽可能不变 。 因此 , 我们建议使用单独的外在和内在表示 。


推荐阅读