此外,我们还比较了不同哈希方法在 NUS-WIDE 上进行单视图相似度搜索的性能 。我们可以观察到,结合了一个实例的多个信息源的 CMFH 可以优于其他哈希方法 。这是合理的,因为当结合多个视图时,一个实例的更多信息可以被编码成哈希码 。此外,这个结果也验证了 CMFH 通过合并多个信息源来提高搜索精度的能力 。
在实际应用中,由于计算资源的限制,数据库的规模可能非常大,不可能对整个数据库进行哈希函数的学习 。而且随着时间的推移,新的数据不断进入数据库,必须为新数据输入哈希码 。本研究的目的是为了解决这些问题,在一个较小的训练集上学习哈希函数,并将其扩展到样本外的实例(数据库中的其他实例或新出现的实例) 。在 NUS-WIDE 上的实验设置与现实世界的场景相当相似 。实验结果表明,CMFH 可以很容易地处理样本外的实例,并且具有处理大规模数据库的能力 。
另外,表 1 还报告了 CMFH 和四种基线方法的跨视角相似性搜索的 mAP 值 。如上结果,CMFH 在跨视角相似性搜索中可以优于所有不同代码长度的基线方法 。

文章插图
上一节中描述的贪心算法的计算成本很高,因为它每一步都要调用一个决策过程 。我们现在提出一种成交相对较低的技术,它依赖于数据,避免了多次调用决策过程 。我们的想法是观察大量输入的激活特征,并学习各种输出属性的决策模式 。在本文中,我们使用决策树学习来提取基于层中神经元的激活状态(激活或未激活状态)的紧凑规则 。采用决策树是很有必要,因为决策树能够根据各种信息理论的衡量标准得到一个决策模式,并且是紧凑的(因此具有较高的可靠性) 。所得到的模式是经过实证验证的层属性,可以通过对决策过程的一次调用来正式检验 。
4 总结多模态数据的跨视图相似性搜索 。CMFH 通过协同矩阵分解与潜因子模型从一个实例的不同模态中学习统一的哈希码,可以对不同视图进行搜索 。我们还表明,CMFH 是一种具有近似双连续性的相似性保存哈希方法 。
我们进行实验来验证所提出的 CMFH 的有效性 。我们表明,在所有的跨视角和大多数单视角相似性搜索实验中,CMFH 的性能比几种最先进的哈希方法好得多 。参数分析表明,CMFH 对参数设置并不敏感,在很宽的参数值范围内都能提供显著的性能 。此外,CMFH 能够轻松处理样本外的实例,并且能够从大规模数据库中以合理的小训练集学习稳定的哈希函数,这使得它适用于实际场景 。
5 致谢本文由南京大学软件学院 2019 级硕士刘佳玮转述
【基于协同矩阵分解的多模态数据的哈希方法】
推荐阅读
- 微信推出开发者版:基于Android版v7.0.18
- 基于libvirt 和QEMU在macOS安装Ubuntu
- 自媒体矩阵怎么做?怎么运营多个自媒体?
- 基于WPF的串口调试工具
- 完全基于 Java 的开源深度学习平台,亚马逊的大佬带你上手
- 手把手带你nginx搭建基于rtmp或者http的flv、mp4流媒体服务器
- 基于无线传感器网络的智能交通系统
- Linux定时器 - 高性能定时器
- 基于 Vue 技术栈的微前端方案实践
- 一款基于 Python 语言的 Linux 资源监视器
