DeepTech深科技|一种新方法或让AI模型拥有“联想”力,或能识别从未见过的事物( 三 )
然后 , 他们让 kNN 算法绘制了它从样本中看到的边界线 , 发现它成功地将样本分成了比数据点更多的类别 。
本文插图
图 | 上图中 , 有两个实例可以调节机器学习模型(用黑点表示) 。 经典的 kNN 算法会在两个点和类别之间分界 。 但 SLaPkNN 算法在两个类别之间创建了一个新的类别(绿色区域) , 它代表着一个新标签 。 这样 , 研究者用 N-1 个样本实现了 N 类别 。
通过对类别边界线的复杂编码和样本软标签的调整 , 他们让 kNN 算法精确画出不同形状的花朵图案 。
本文插图
图 | 作者在论文中炫技 。 图表上的每个彩色区域代表一个不同的类别 , 每个图表侧面的饼图则显示了每个数据点的软标签分布 。
当然 , 凡事总有两面 , 这个方法也有其局限性 。
当伊利亚和导师尝试将 “少于一次” 样本学习的方法应用到其他更复杂的算法(如深度学习等)时 , 他们发现设计软标签的工作变得异常困难 。
kNN 算法具有很好的可解释性和可视性 , 为人们设计标签提供了良好基础 。 但神经网络是复杂且不可穿透的 , 这意味着同样的方法未必可行 。 并且 , 设计用于 “凝练” 神经网络训练数据的软标签时也有一个主要难点:设计者需要面对庞大的数据集并凝练出有效的内容 。
这一工作目前看来不可能全部通过人工完成 。 伊利亚说 , 他现在正在研究其他方法来设计这些凝练后的合成数据集 —— 无论是手动设计还是使用其他算法进行设计 。
尽管存在诸多挑战 , 但不可否认这篇论文为 “少于一次” 样本学习提供了理论基础 。 “无疑经过凝练的数据集将带来极大的效率提升 。 ” 伊利亚说 。
本文插图
图 | 伊利亚(Ilia Sucholutsky)
需要从图像或视频帧中识别成千上万个类别的计算机视觉系统(如自动驾驶)、执行情感分析的自然语言处理系统等都将从中受益 。
Tongzhou Wang 对此补充道 , 这篇论文同时也提出了一个非常新颖且重要的目标 ——如何从小数据集中训练强大的模型 。
从人类的学习经验来看 , 这是能够实现的 , 应用领域也异常宽广 。 从抓捕只有一张照片的犯罪嫌疑人 , 到识别海上航行的敌方舰艇 , 都是典型的小样本场景 。
对于这项成果 , 也有业内人士指出 “可能很难实现” 。 一名杜克大学的计算机科学博士生告诉 DeepTech:“用很少的样本去生成很多的类 , 是一件非常反直觉的事情 。 虽然他做到了这一点 , 但后续依然需要将各种特征组合成现实中的真实事物 。 ”
该博士生分析称 , 如果把人类的眉、目、鼻、口、耳这五官特征提取出来 , 然后通过伊利亚的方式整合到一起 , 可能可以组成世界上所有存在、不存在的人脸 , 但在训练模型的时候 , 依旧需要让机器知道真正的人脸是怎样的 。
也就是说 , 模型通过伊利亚的方法训练之后 , 还需要再增加一个新的步骤来实现闭环 , 这个新的学习步骤如何实现 , 以及实现的难易程度 , 才是关键所在 。 并且 , 五官的特征也是需要从大量的、有标签的数据中来的 。 但他也承认 , “从这个角度看 , 这篇论文的确提出了一个非常新颖的思路 。 ”
最后 , 伊利亚强调这个研究尚处在早期阶段 , 但他对此充满信心 。
【DeepTech深科技|一种新方法或让AI模型拥有“联想”力,或能识别从未见过的事物】他说 , 每当他向其他研究人员介绍这篇论文时 , 他们的第一反应是说这个想法不可能实现 , 但紧接着他们便意识到事实并非如此 , 它可能无意间触及了一扇通往全新世界的大门 。
推荐阅读
- 材料|百利科技:首家锂电正极材料智慧工厂建成,氢能材料项目稳步推进
- 服务|薪宝科技荣获2020(深圳)人力资源数字化科技大赛二等奖
- 金融营销新视界|拥抱金融科技,中国银行持续提升用户体验!
- 百福地|霸州市百福地科技有限公司 | 用实力打造高品质美容仪器车
- 汽车|用科技俘获用户芳心“智慧”让BEIJING-X7美得更丰满
- 超新星|树木年轮或是超新星影响地球印迹
- 农业|农业无人机初创公司极飞科技宣布完成12亿元融资
- 科学|金属所在极细多晶体铜中发现一种新型亚稳固态-受限晶体结构
- 农业|农业无人机初创企业极飞科技宣布完成12亿人民币融资
- 文库科技标杆|问题解决一半,华为可向高通购买芯片,但不包括5G芯片!
