「」计算所山世光:AI方法论需升级,疫后 AI 将如何发展?( 二 )


2、未来10年的AI方法论:知识+数据联合驱动
AI 能力的升级 , 必须依赖AI 方法论的升级 , 而这归结到本质 , 还是算法的革新 。
山世光研究员提出如下几种亟需发展的AI算法——
「」计算所山世光:AI方法论需升级,疫后 AI 将如何发展?
文章图片

文章图片

举例来说 , 算法能否在数据量减小到原来10%甚至1% , 同时还保持和原来相当的能力呢?在现有的算法(纯数据驱动)中 , 是否可以加入知识 , 或者已有的其他数据或模型 , 做到知识和数据联合驱动?……事实上 , 已经有许多研究单位在做 , 也是当下AI算法上最值得探索的几个研究方向之一 。
针对以上内容 , 山世光从「数据依赖」的角度做了详细说明 。前面提到 , 当前人工智能的方法是强大 (强监督、大规模) 数据依赖 。但我们知道人类智能并不是如此 , 简单举几例人类的能力:
归纳和演绎推理:从个别到一般 , 再从一般到个别;
举一反三&触类旁通:类似推演&迁移学习;
吃一堑长一智:从少量错误中学习(修改模型);
预测检验:时刻预测并修正误差;自纠错学习;
元方法:道生一 , 一生二 , 二生三 , 三生万物;
融会贯通:多模态、多学科知识校验和融合;
想象力和创造力:无中生有 , 外插而非内插 。
从这些能力中 , 我们可以看出 , 人类的智能本质上是一种知识+弱小(弱监督、小样本)数据驱动的方法 。这种特性值得我们参考 。
山世光研究员认为 , 人类能够做到小数据的学习 , 原因在于有知识的积累 。因此如何把知识融合到机器当中 , 对于AI算法非常重要 。这里的知识既可能是人类总结出的知识 , 也可以是已有AI学到的知识 , 他把后面这种知识称之为“机器知识” 。
「」计算所山世光:AI方法论需升级,疫后 AI 将如何发展?
文章图片

文章图片

所谓“机器知识” , 不同于“人类知识” , 很可能不是人类可阅读的 , 甚至不是人类可理解的 。如山世光研究员所说 , 当我们已经用算法解决了N个任务(例如识别人脸、猴脸、马脸、狗脸、牛脸等)后 , 机器就有可能从这些任务中总结出一些通用任务的规则 , 作为“元”模型 。
有了“机器知识” , 即使是小数据/无数据的任务 , 也能够获得好的性能 。例如可以借助上述从人 / 猴、马、狗、牛等学习到的脸部识别模型 , 得出一个关于脸的“元”模型 , 用来识别考拉脸、鱼脸、熊猫脸等 。
(现在的方法则往往是 , 识别一个动物 , 就要收集大量这个动物的脸部照片 , 换种动物就得重新收集和学习 , 既不高效 , 也不优雅 , 甚至笨拙的有点可笑 。)
事实上 , 这种研究本质上是多任务协同的问题 , 在2018年已经有人在做 , CVPR 2018的最佳论文正是其中的代表 , 这个工作研究了26个不同任务之间的关系 , 以及如何可以互相支撑 , 从而减少对标注数据的需求 。
「」计算所山世光:AI方法论需升级,疫后 AI 将如何发展?
文章图片

文章图片

基于以上的分析 , 山世光研究员认为 , AI的方法论 , 在过去十年逐渐变为以强、大数据驱动为主 , 但接下来的十年或更长时间里 , 知识和数据联合驱动将成为主流 。当然这里的知识 , 并不仅仅指人类可以理解的知识 , 也可能是许多人类无法理解的“机器知识” 。
3、五大观点&建议
在报告的后半部分 , 山世光研究员针对目前我国的人工智能发展 , 提出了五大观点和建议 , 如下:
1)AI应用研究方面差距不大
中美(欧)之间在应用研究上差距不大 , 但我们在各行业纵深应用(即在其他研究领域)上仍需努力 。例如 , AI在生物信息领域的应用 , 西方的积淀很多 , 深度学习也渗透了很多 , 而我国在这方面就需要努力赶超 。


推荐阅读