IT新经济|数据不够,技术来凑:单样本学习也可以很简单!( 二 )


出于可操作性和隐私考量 , 这样的想法并不现实 。
此时 , 单样本学习便可发挥作用 。 单样本学习并不做分类处理 , 而是作差异性评估 。
单样本学习的解决方案有以下两种:
重新利用卷积神经网络进行单样本学习
单样本学习的重点不在于分类 , 而是将任务转变为差异评估问题 。
举一个例子 , 海关官员在核查入境人员时 , 主要根据护照照片和当时入境人员的样貌判断是否为同一人 。 采用单样本学习网络验证时 , 网络同时对证件照片和实际面貌进行分析 , 通过上述卷积、池化和全连接等过程 , 并最终返回一个数值用以表示两个图像之间的相似性 。 如果图像包含相同的对象(或相同的面孔) , 则神经网络返回的值小于特定阈值(例如零) , 如果它们不是同一对象 , 则该值将高于阈值 。
可以看出 , 这一方案是没有建立数据库的 , 仅仅是用机器代替了人工进行面部识别 , 但过程中运用到的原理和我们上述的卷积神经网络一样 。
这和我们日常生活中使用的手机面部解锁功能相似 , 录入的面部信息就是我们“证件照” 。
孪生神经网络(Siamese network)
这一学习网络基于相似形函数 , 它有两个并行的神经网络 , 每个神经网络验证的目标不同 , 合并之后输出数值并进行预测 。
在这一神经网络中 , 图像输入之后其特征就被编码为一组数字 。 本质上和卷积神经网络并没有太大的区别 , 二者的不同体现在输出处理方面 。
在卷积神经网络中 , 网络会不断学习 , 调整参数 , 以便图像可以归入适当的类别 。 而孪生网络则测量两个输入图像各自特征的差异 。
为此 , 我们引入三重态损失函数(Triplet loss) 。
这一函数的诞生就是为了解决在仅有有限小数据的情况下建立人脸识别系统 。
此处的三重指的是:锚图像(Anchor)、匹配图像(Positive)和不匹配图像(Negative) 。
锚图像可以理解为我们输入数据库中的面部数据 , 匹配图像则是实际解锁时的面部照片 , 不匹配图像则是他人的照片 。
在这一过程中 , 网络需要比较图像对 。 首先需要查看锚图像 , 并且获取锚图像和匹配图像之间的差异 , 随后对不匹配图像进行相同操作 。 孪生神经网络需要不断调整 , 以确保锚图像和匹配图像的特征编码非常接近 。 训练完成后 , 该神经网络应当可以判断两个新的面部图像中是否为同一人 。
诚然 , 孪生神经网络也有局限性 , 它的训练仍需要较大量的APN图像 。 但是与经典的卷积神经网络相比 , 创建训练数据还是要比对每个图像的典型特征进行标记来的轻松 。
单样本学习的需求很大 , 但其投入产出比往往并不令人满意 , 因为用于单样本学习的每个神经网络仅对某项特定的任务有用而已 。 再者 , 其使用也很有局限 , 训练用于人脸识别的网络无法用于识别他物(这一问题在卷积神经网络中便不会发生) 。
【IT新经济|数据不够,技术来凑:单样本学习也可以很简单!】本文来源前瞻网 , 转载请注明来源 。 本文内容仅代表作者个人观点 , 本站只提供参考并不构成任何投资及应用建议 。 (若存在内容、版权或其它问题 , 请联系:service@qianzhan.com)


推荐阅读