「恒大」坚持基础设施建设是长期战略 从旷视开源看人工智能产业发展新动线( 二 )


那么在中国新基建究竟应该谁来干?从哪儿开始干?最近一家人工智能企业给出了答案 。
2
从基建的基建做起
和传统的实体基建一样 , 新基建也是庞大的工程 。 就像修建铁路要先铺轨道 , 建高楼要先打地基 , 新基建的建设也应该从基础发力 。
以人工智能为例 。 人工智能产业链本质上包括三层:基础层(计算基础设施)、技术层(软件算法及平台)和应用层(行业应用及产品) 。 目前中国人工智能在应用层如火如荼 , 主要是因为应用场景丰富 , 但是在基础层较为薄弱 , 主流芯片和算法框架话语权都被国外巨头占据 。
“真正影响产业跑速的不是算法、不是软件和硬件 , 也不是解决方案 , 而是AI的基础设施 。 ” 2020年3月25日 , 在旷视一场线上发布会中 , 旷视联合创始人兼CTO唐文斌一针见血地指出发展人工智能产业就要先做好人工智能的基础设施建设 。 旷视认为 , 应用层的场景是无限的 , 这就导致了场景对算法需求的无限性 , 而目前人工智能产业中的算法具有局限性 , 只能维持AI产业的短期的表面繁荣 , 真正影响产业长期发展的应该是从人工智能基础层发力 。
那么人工智能的基础设施具体包括什么?唐文斌给出了他的定义:
这里面我们发现 , 芯片平台作为硬件计算设备是大家公认的基础设施 , 但AI生产力平台该怎么理解?唐文斌解释:“除了芯片 , 人工智能最重要的门槛就是算法研发 。 然而算法研发和普通编程不同 , 是一个系统工程 , 需要能够协同优化数据、算法、算力的平台级产品 , 我们把这三者综合构成三位一体的平台就是AI生产力平台 。 而旷视目前内部已经拥有了这样的平台 , 它诞生在6年前 , 叫做Brain++ 。
但Brain++并不是旷视这次发布会的主角 。 旷视真正发布的是开源其自研AI生产力平台中最为基础的深度学习框架——天元MegEngine 。 也就是说 , 一家拥有核心技术壁垒的人工智能企业要把自己最为核心的算法研发能力 , 传输给外界的企业和开发者——这无异于一个武林高手要当街向众人输送内功 。 这一动作的背后 , 旷视是何考量?
实际上 , 国际市面上已经有了不少的AI开发工具 。 其中 , 谷歌的TensorFlow、脸书的PyTorch拥有全球90%的开发者用户 , 并分别占据了易部署的AI工业场景和可灵活调试的AI科研场景 。 旷视表示 , 发布开源框架并非为了和主流框架竞争 , 而是希望更多开发者和公司有能力加入AI的网络 , 让生态共同繁荣 , 实现共赢 。
3
AI产业需要新的深度学习框架吗?
深度学习发迹于2013年 , 它的出现让人工智能算法研究员告别了手工提取特征的方式 , 是通过在设计上借鉴人类大脑视觉信息分层处理的过程 , 对数据进行高层抽象的算法 。 而深度学习框架 , 简单来说 , 就是编程时需要的库 , 是能够帮助AI开发者提升算法研发效率的开发工具 。 有了框架开发者就不需要从零开始去写一套机器学习的算法 , 可以根据所需 , 使用框架中已有的模型 , 直接进行组装 。 近几年 , 深度学习的高速发展催生了人工智能迎来了第三次春天 。
像10年前有网线和网站的企业自称为“互联网企业”一样 , 今天 , 大多数企业只要用到了深度学习技术就会称自己为“人工智能企业” 。 虽然主流的深度学习框架已经盛行、演进多年 , 但是传统企业和普通开发者与AI之间仍隔着高高的壁垒:如果产业公司想要将业务和AI结合 , 就要构建自有的AI研发团队 , 并投入不菲的成本针对自身业务做贴身改造 , 另一方面AI人才供不应求 , 懂行业又懂技术的复合人才更是难觅 , 且无法在短时间内看到利润提升 , 这些都是传统行业智能化改造的掣肘因素 。
发布会中 , 旷视云服务业务资深副总裁赵立威向业界展示了传统企业应用AI的一些共性问题:
同时 , 在人工智能科研和产业化摸爬滚打了8年的旷视 , 对此提出了新的解题思路:要想解决上述矛盾 , 除了让AI公司的工程师们与产业交流磨合外 , 还可以通过降低AI开发工具的使用门槛和开发效率 , 让深度学习框架更易用 , 并刺激一部分产业先试起来 。


推荐阅读