雷锋网@产业AI化的算力流水线,浪潮如何实践?( 二 )


N20X智能网络加速方案可将主机网络、存储和计算的负载的卸载到网卡 , 对主机计算、存储和网络实现有效的加速 , 它支持 OVS、 NVMe、Virtual IO的技术融合 , 甚至能够实现接近于物理机性能的裸金属服务 , 容器和VM分钟级资源交付 。
调度算力:AIStation资源平台 , 模型开发和部署一站式交付
如何能把生产、聚合之后的算力高效的调度用于更多的创新?
AI应用从开发环境、生产环境 , 模型上线、部署复杂度远超以往 , 人工智能企业需要一个强大的高效的资源管理平台 , 帮助完成一站式模型开发和部署 , 这就是浪潮AIStation资源平台 。

雷锋网@产业AI化的算力流水线,浪潮如何实践?
本文插图

AIStation训练平台首先能够解决研发模型开发训练的挑战 , 实现高效共享AI算力 , 加速AI创新的研发 。 通过AIStation , 企业不同工作小组 , 不同开发者 , 都可以高效共享AI服务器资源 , 保证算力资源的高效利用 。
“我们可以实现计算资源非常细粒度的切割共享 , 一块GPU资源可以共享到多个用户来同时使用 , 面对训练场 , 大规模数据集的IO挑战 , 我们实现了对训练数据的缓存加速 , 越来模型开发和训练越来越复杂 , 浪潮在AIStation上海提供了分布式训练和编排 , 保证开发人员尽可能自动化调度更大规模的计算力 , 来提升AI训练模型的精度 。 ”刘军解释道 。
在AI模型生产上线阶段 , AIStation推理平台可以帮助客户部署和推理 , 从而提速整个AI生产交互过程 , 这其中浪潮解决了很多问题 。 比如兼容多种深度学习框架和推理服务 , AIStation推理版本能提供多模型计算结果 , 保证推理结果的准确性和可信度 。
释放算力:升级AutoML Suite自动机器学习平台 , AI全自动建模
雷锋网了解到 , 仅就单一AI应用 , 其实现平均至少需要消耗6个人月的专家人力 , 以智能化工具提升AI开发的效率 , 有效降低人力的成本 , 成为不少企业用户的诉求 。
浪潮升级了AutoML Suite自动机器学习平台 , AutoML Suite可实现企业级一站式模型自动构建 , 支持私有化部署 , 全面支持图像分类/回归/目标检测CV场景应用 , 模型大小与计算量极致压缩 , 用户提供原始图片数据和标注数据 , 经过AutoML Suite处理 , 自动生成所需的AI算法模型 。

雷锋网@产业AI化的算力流水线,浪潮如何实践?
本文插图

AutoML Suite之所以可实现上述功能 , 来源于其三大核心引擎: AutoNAS可根据数据特性 , 从无到有构建网络模型 , 实现AI模型与用户应用场景的最佳匹配; AutoTune可进行超参自动调整 , 使算法工程师从繁琐耗时的手动调参中解放出来; AutoPrune基于元学习技术 , 可对任意网络进行无损压缩 , 使生成的模型满足用户应用生产部署要求 。
目前 , 浪潮AutoML Suite已在智慧城市、铁路、公路等场景中得到应用 。 在智慧城市路口通过监测领域 , 基于40万数据集 , AutoML自动生成的模型在日间识别准确率达91.5% , 夜间识别准确率为83.6% , 高于专家手动设计模型精度;在铁道开口销设备故障检测中 , 运用浪潮AutoML Suite自动生成的模型实现了81.8%的召回准确率;在高速公路团雾识别领域 , 对14000张图片进行搜索训练后 , 自动生成模型对团雾的检出准确率率为99.25% , 模型效果符合生产应用水平 。
“未来五年、十年 , 人工智能会成为未来最核心的计算力 , 面临大数据和深度学习的计算需求 , 人工智能会带来一个指数型增长的对计算力的需求 。 浪潮一直致力于创新AI计算 , 也是为我们当前的新基建提供原动力 , 浪潮会提供最领先的算力机组来生产算力 , 我们会通过更敏捷的数据中心来聚合算力 , 通过高效的调度算力我们产业AI提供更多创新的可能 , 同时通过释放算力来快速落地进化AI 。 ”刘军总结表示 。


推荐阅读