[人工智能]从算法爬坡到 AI 基建,旷视“天元”开源背后的 AI 生产力破局( 二 )
除了最新开源的天元(MegEngine) , 目前国际主流的几种深度学习框架主要包含谷歌大脑2015年开源TensorFlow、谷歌的人工智能研究员Fran?ois Chollet 2015年推出的Keras、Amazon 2015年底开源的MXNet、Facebook 2016年开源的PyTorch、微软2016年开源的CNTK、百度2016年开源的飞桨等 。 天元(MegEngine)则从实际开发经验中的几个痛点入手 , 在性能上表现不俗:
1. 训练推理一体化
旷视天元既可支持研究员进行算法训练 , 同时训练得到的模型和产物是可以直接进行用于产品的推理、封装 。 省去模型转换不仅极大简化算法开发流程 , 更实现了速度和精度的无损迁移 , 即使是模型的跨设备部署 , 天元依然能够做到精度的对齐 。 在部署时 , 天元还可以帮助开发者自动删除冗余代码 , 实现模型自动优化 。
本文插图
2. 动静合一
静态图性能高、占用资源少且易于部署;动态图简单灵活、方便调试且易于上手 。 旷视天元整合了动态图与静态图各自的优势 , 在充分利用动态图模型训练优势时 , 通过动静态一键转换功能 , 以静态图的形式完成生产和部署;此外 , 天元还支持动静态的混合编程 , 灵活性更强 。
本文插图
3. 兼容并包
旷视天元具备Pythonic的API , 这对习惯用Python进行传统机器学习的开发者来说非常友好 , 学习成本更低、易于上手 , 同时天元还支持PyTorch Module功能 , 可以直接导入模型 , 迁移成本低且极大方便模型复现;天元内置高性能计算机视觉算子和算法 , 可为计算机视觉相关模型训练和应用实现深度优化 。
本文插图
4. 灵活高效
旷视天元具备很强的多平台多设备适应能力 , 可通过类似汇编和指令重排等技术 , 使得天元内置算子能够在推理或生产环境中充分利用多核优势 , 灵活调用设备的计算力 , 尤其适用于大模型算法训练 。
本文插图
总的来说 , MegEngine 在协同设计、高效训练、大规模训练能力上 , 做到了更完整的统一与升级 。
相比平台级公司的科技巨头 , 旷视成立之初便是一家以 AI 为驱动的企业 , 天元深度学习框架的开发以其核心业务为土壤 , 在应用场景和落地案例中经过不断的反馈、调试 , 尤其在视觉任务的处理上 , 更加适合开发者 。
基于与TensorFlow、PyTorch 等框架的不同优势 , 开发者也可以同时使用不同框架 , 解决自身问题 。
生态共建者
过去几年 , 中国企业纷纷拥抱开源 , 但多数是被形势驱动 , 勉力上赶 , 早期便做下铺垫并持续技术积累的不多 , 从这个角度看 , 旷视算是个异类 。
2014 年 , 深度学习刚刚兴起不久 , 当时公司使用的还是 Theano 框架 , 效率低下 。 旷视研究院的 3 名实习生 , 在其自动化算法研发系统 Cycle++ 的基础上 , 不到半年的时间里 , 写出了一个初版的深度学习框架 , 便是 MegEngine 的雏形 。
MegEngine 诞生的第二年 , 谷歌开源了 TensorFlow 。在深度学习框架的选择上 , 买巨头的船票 , 还是自己造船 , 团队内部经历了长久的争论 。
高投入的自研意味着对团队的极大考验 , 此时 , 成立不到 4 年的旷视 , 技术团队尚不足20人 , 再配合业务的落地推进 , 难度指数级增长 。 但刚刚开源的 TensorFlow 尚有不少缺憾有待完善 , 对团队来说 , 远不如自研的 天元(MegEngine )称手 。 并且 , 对于一个以 AI 为绝对主业务的企业来说 , 长期来讲 , 自研深度学习框架更易于面向自身需求调整、迭代算法 。
推荐阅读
- 2020改变就在眼前,量化派助力多行业人工智能化
- 『接风娱乐』人机对战协作新时期已经来临,提高智能化与人工智能技术趋于结合
- 「TalkingData」打造智能化的小微企业信用评估体系?,如何用数据+算法
- 游戏谈▲人工智能上线助力疫情!5天时间如何如何完成?
- [人工智能]“智慧大脑”赋能河南制造
- 人工智能■京东商城背后的AI技术能力揭秘 - 基于关键词自动生成摘要
- 「人工智能」AI独角兽第四范式完成C+轮融资,估值约20亿美元
- 合墨数据携手中科大人工智能博士团队,引领智能风控新未来
- [就要买买买]人类会原谅机器吗?,人工智能浪潮之下
- 『』霍金预言的事情正在发生?人工智能“读脑术”准确性高达97%
