「就要买买买」AI开发生态有望焕发新生机,旷视计划3月底开源深度学习框架( 二 )


缺失国产深度学习框架 , 和缺少芯片一样是“卡脖子”问题深度学习框架的竞争 , 已经成为人工智能竞赛的制高点 。 世界范围内 , 市场主流的开源深度学习框架大多数是国外厂商或机构主导 , 比如Google的TensorFlow和Facebook的PyTorch占据了大部分市场份额 。
「就要买买买」AI开发生态有望焕发新生机,旷视计划3月底开源深度学习框架
文章图片
在中国 , 开发者也高度依赖国外的开源框架 。 2019年7月 , 长江商学院经济学教授许成钢在一堂课上给出了一个数据 , 几乎93%的中国研究者使用的人工智能开源软件包 , 是美国的机构开发提供的 。
这无疑是一个不好的信号 , 高度依赖国外的开源深度学习框架相当于被“卡住了脖子” 。
近几年 , 中国人工智能应用领域发展非常迅猛 , 但这更多得益于庞大用户量产生的数据红利 。 深度学习框架好比人工智能产业的地基 , 纵使盖出了再高的楼 , 没有自己的地基 , 也有非常大的崩塌风险 。
类似的情况已经在芯片领域发生 。 2015年 , 国防科技大学主导的超级计算机“天河二号” , 因英特尔至强处理器断供 , 打断了原定升级计划 。 被“卡住脖子”的天河二号 , 在2018年借助中国自研的Matrix-2000加速卡才完成升级 。
2019年 , 华为海思总裁一份致员工信广为传播:多年前 , 公司做出了极限生存的假设 , 预计有一天 , 所有美国的先进芯片和技术将不可获得 。 为了这个以为永远不会发生的假设 , 数千海思儿女为公司的生存打造“备胎” 。 今天 , 曾经打造的备胎 , 一夜之间全部转“正”!
「就要买买买」AI开发生态有望焕发新生机,旷视计划3月底开源深度学习框架
文章图片
在深度学习框架领域 , 也有必要做出类似华为海思这样的极限生存假设:如果有一天TensorFlow这些国外的深度学习框架不再开源 , 中国的人工智能开发者有什么替代方案?
“卡脖子”问题的新答案:旷视将开源深度学习框架MegEngine事实上 , 不少中国企业都意识到了这个问题 , 也交出了解决方案 。 比如百度的PaddlePaddle和华为的MindSpore 。
有业内人士透露 , 很快人工智能开发者又有多一个选择:旷视将于3月底开源其人工智能算法平台Brain++的核心深度学习框架——MegEngine , 主要面向高校师生、传统产业和中小企业的AI开发者 。
相比大部分深度学习框架 , MegEngine特别针对计算机视觉进行深度优化 , 不仅支持大规模分布式训练 , 且兼容Pytorch、学习成本低 。 在旷视内部 , MegEngine主要就是用于计算机视觉领域的开发 。 据旷视研发同学称 , 即便是新同学不到1个月就可以快速上手 。
在架构上 , MegEngine共分为“计算引擎”、“运行时管理”、“编译和优化”、以及“编程和表示”四个层级 。
「就要买买买」AI开发生态有望焕发新生机,旷视计划3月底开源深度学习框架
文章图片
计算引擎以MegDNN为核心 , 发挥计算作用 。 MegDNN是一个基于异构架构 , 有着统一交互方法的内核 , 可以根据设备本身启发式地选择最优内核 , 也可以让用户自己选择最适合的内核进行计算 。
运行时管理层包括两个模块 , 分别是内核调度和内存管理和优化两大模块 。 在内存管理和优化模块中 , MegEngine采用了动态、静态内存分配并存的方式 , 因此可同时支持动态图和静态图模式 。
而在编译层和优化层 , MegEngine使用了基于计算图的编译和优化方法 。
事实上 , 2013年推出的Caffe采用了配置文件方式表达网络结构 , 在当时已经难以满足开发一些大型神经网络的需要 。 后来 , TensorFlow2015年发布时 , 采用了计算图的方式 , 很好适应了大型神经网络开发的发展 。 而值得一提的是 , MegEngine在2014年开发之初 , 也采用了计算图的方式 。
「就要买买买」AI开发生态有望焕发新生机,旷视计划3月底开源深度学习框架
文章图片


推荐阅读