AI|WAIC汇聚全球顶级科学家畅想AI未来 第四范式戴文渊提出AI落地三大门槛

7月9日,2020世界人工智能大会(WAIC)正式拉开帷幕 。 下午,2020世界人工智能大会科学前沿全体会议召开,作为今年WAIC唯一一场聚焦前沿科技的大会,邀请了世界范围内最顶级的AI专家探讨技术趋势 。 第四范式创始人兼首席执行官戴文渊受邀出席,参与由AAAI2021大会主席杨强教授主持的“人工智能的未来挑战与突破”圆桌,与来自香港科技大学的张潼教授、新南威尔士大学的Toby Walsh教授、札幌市立大学校长中岛秀之以及英国帝国理工学院数据科学研究所所长郭毅可共同探讨AI未来 。
AI|WAIC汇聚全球顶级科学家畅想AI未来 第四范式戴文渊提出AI落地三大门槛
图片

“人工智能的未来挑战与突破”圆桌论坛现场
戴文渊在演讲中提出了当下人工智能发展面临的三个门槛:
一,认知门槛
这是企业在AI应用中面临的普遍问题 。 现在我们看到人工智能应用越来越多,特别是在复杂的商业环境当中,人工智能的应用也越来越重要 。 我举一个例子,我昨天去拜访了一家餐饮巨头,他们跟我说想要把线下的业务放到线上去,改变业务模式 。 传统上,他们是开一家家线下实体店,然后进行线下业务管理,但是他们发现疫情后只有5%的营收是来自于线下的,95%的营收是通过线上数字化渠道来的 。 此前他们通常会让门店员工给线下客户派送消费券,再给客户做一些产品推荐和附加服务,需要花费很多的人力和物力 。 如果是通过线上化渠道,这样大的任务量,是不可能通过人工来完成的 。
这是个非常适合AI的场景,可以通过AI让机器来完成线上化的营销、推荐等,不需要由人来做 。 但核心问题是,这些AI应用需要数据科学来构建,但传统企业没有足够的数据科学家,就没有办法解决这些问题 。 我们现在数据科学家数量远远不够,就算是MIT的数据科学家也不能解决所有企业的所有需求 。 所以,我们认为需要让普通开发者或者JAVA工程师,也能够开发AI应用 。 然而JAVA工程师会说他没办法做到,因为人工智能太难了 。 这也是为什么过去五年我们把很多的时间都花在了自动机器学习(AutoML)的研究上,它是一个学习框架,能够让普通开发者去学习构建足够好的AI应用 。 我认为现在的数据科学家太少了,我们必须要努力发展低门槛的AutoML技术,这是第一个挑战 。
二,数据门槛
第二个挑战是即使我们有足够多的数据科学家,即使我们可以通过让普通人开发AI技术,缺乏高质量的数据,AI也无法实现 。 这就需要我们通过迁移学习把数据中的知识从一个领域迁移另一个新领域,保证AI在新领域的应用及效果 。 过去我们一直努力发展迁移学习算法,有很多优秀的迁移学习算法 。 但我们发现开发迁移学习系统,它的性能非常好,但有隐私的问题 。
AI基于数据得出的一些结论被应用是可以被大家接受的方式,前提是这些结论并没有记录个人具体的数据 。 最近几年我们在迁移学习隐私保护领域取得了比较大的突破,联邦学习在隐私保护的基础上赋能数据共享,能够把知识从一个领域迁移到另外一个领域,同时也不会导致隐私暴露 。 今年年初,第四范式先知率先通过了欧盟GDPR认证,成为国内第一款通过该认证的AI平台产品 。
三,成本门槛
第三个挑战是成本的问题,我们发现顶尖的互联网公司,需要有很多服务器来支撑AI业务,甚至会花费上百亿在搜索引擎、推荐引擎上,很少有公司能够承受这么大的成本 。 所以我们必须要花费一些精力研究如何降低服务器的成本费用 。 AI不仅是硬件系统,还有软件系统,是硬件和软件深度融合的体系,软件设计必须要基于硬件的特点,硬件设计也必须结合软件的需求,并做进一步的优化 。
我们发现采用软硬件深度融合优化的方式,不止性能会提高十倍,成本也会大幅降低 。 以第四范式服务的某零售企业推荐场景为例,过去需要采用88台传统服务器才能支撑AI业务,采用软硬一体的方式后降为8台,TCO(总拥有成本)降低了90% 。 这是我看到的第三个挑战 。


推荐阅读