性别|论文盘点:性别年龄分类器详解( 二 )
本文插图
由上面两张图是系统所犯的许多错误都是由于某些 Adience 基准图像的观看条件极为困难所致 。 最值得注意的是由模糊或低分辨率和遮挡(尤其是浓妆)引起的错误 。 性别估计错误也经常发生在婴儿或非常年幼的儿童的图像中 , 因为这些图像还没有明显的性别属性 。
IWBF 2018
本文插图
论文标题:Age and Gender Classification from Ear Images
论文来源:IWBF 2018
论文链接:https://arxiv.org/abs/1806.05742
2.1 论文贡献
该论文是一篇有趣文章 , 研究是从耳朵图像进行年龄和性别的分类 。 作者采用卷积神经网络模型 AlexNet、VGG-16、GoogLeNet 和 squezenet 。 在一个大规模的耳朵数据集上进行了训练 , 分类器通过人耳对性别和年龄进行分类 。 该论文的贡献分为三个部分:
- 对于几何特征 , 作者在耳朵上使用了 8 个标志点 , 并从中衍生出 16 个特征 。
- 对于基于外观的方法 , 作者使用了一个大型 ear 数据集 , 利用卷积神经网络模型来对年龄和性别进行分类 。
- 与之前的工作相比 , 作者在性别分类方面取得了优异的成绩 。
2.2.1 几何特征
下图为人耳标志位和相关的几何特征 。 由于每个几何特征具有不同的取值范围 , 为了使其规范化 , 作者在训练集中计算了每个特征的均值和标准差 。 然后并对它们进行归一化 , 使它们具有零均值和单位方差 。 在 16 个耳朵的几何特征中选择出重要的6个 。
本文插图
2.2.2 基于外观的表示与分类
本研究中使用的第一个深度卷积神经网络结构是 AlexNet 。 AlexNet 包含五个卷积层和三个全连接层 。 在网络训练中 , 为了防止过度拟合 , 采用了 dropout 方法 。 第二个深度卷积神经网络结构是 VGG-16 。
VGG-16 包含 16 个卷积层 , 3 个全连接层和在卷积层之后的 softmax 分类器 。 第三个深度卷积神经网络结构是 GoogleNet , 它是一个更深层次的网络 , 包含 22 层 。 它基于初始模块 , 主要是几个初始模块的串联 。
inception 模块包含几个不同大小的卷积核 。 将不同的卷积核输出组合起来 。 最后一个 CNN 架构是 squezenet , 它提出了一种减少参数数量和模型大小的新方法 。 使用 1×1 过滤器 , 而不是 3×3 过滤器 。 该体系结构还包含剩余连接 , 以提高反向传播学习的效率 。 此外 , 没有全连接层 。 使用平均池化层 , 而不是全连接层 。
2.3 实验结果
2.3.1 数据集介绍
论文选用的数据集包含 338 个不同对象的面部轮廓图像 。 这个数据集中的所有受试者都超过18岁 。 从下图可以看到来自数据集的样本图像 。 这些受试者分为五个不同的年龄组 。 这些年龄组分别为 18-28、29-38、39-48、49-58、59-68+ 。 根据几何特征的变化对年龄组进行分类 。
本文插图
2.3.2 性别分类结果
如下表所示为性别分类的结果 , 第一列为分类器的名称 , 第二列包含相应的分类精度 。 为了提醒读者所使用的特性 , 第二列的括号中包含了这些特性的类型 。 从表中可以看出 , 基于外观的方法优于基于几何特征的分类器
推荐阅读
- 奔驰S级|盘点几款九月份正式上市的新车,全新奔驰S级领衔
- 彭于晏|盘点娱乐圈的两大“痴情汉”, 一个暗恋7年, 一个追了10年!
- 穿搭|演技好颜值高,堪称“行走的衣架子”,盘点宋佳的穿衣搭配
- 电影|当演员入戏太深会怎么办?盘点那些年,被角色改变的演员们
- 卡车之家|新公告燃气车盘点,康明斯15L机出场,550马力太霸道
- 吃货|解放你的味蕾,盘点身边那些热门的美食记忆与文化
- 小型SUV|方盒子的复兴 盘点四款热门硬派越野车
- 情感小才子|《摩天大楼》钟美宝:性别偏见,始终是女性身上去不掉的“枷锁”
- 男生|盘点最靠得住的星座男,不可错过
- 论文|当我们说论文的时候,究竟在说什么?
