模型|惠普Z8 G4工作站评测:中小型AI模型训练“神器”( 二 )
1、基本的环境配置和参数
根据NVIDIA官网的推荐 , 针对NVIDIA Quadro RTX 8000我选取了450版本的驱动进行了安装 , 并安装了相应版本的CUDA 11.0 , 实现对GPU计算调用加速 。 在Linux下可以通过命令NVIDIA-SMI看GPU驱动以及CUDA版本信息 。 如下图所示 。
文章图片
通过CUDA自带的案例程序 , 也可以测试并查看一些基本的计算参数 , 如:
- – CUDA核心数目
文章图片
从图中的输出的信息来看 , CUDA核心数目为4608个 , 同时提供48601MB的存储器 , 1.77GHZ的最大频率和7001MHZ的显卡频率 。
- – 浮点计算能力
文章图片
- – 单精度浮点运算
文章图片
2、图像分类与目标检测模型的训练
(1)基于CIFAR-10和ImageNet数据集的分类模型训练
在本次的分类模型训练中 , 我分别使用了简单的CNN网络和经典的ResNet50网络 , 分别对CIFAR-10数据集和ImageNet数据集进行了分类训练 。
- – 模型介绍与数据集介绍
CIFAR-10数据集是一个比较小、也比较常见的图像分类数据集 , 其共有60000张32×32的彩色图片 , 图片分为10类 , 每类6000张图 。 其中有50000张用于训练 , 10000张用于测试 。
ImageNet数据集则是一个用于视觉对象识别软件研究的大型可视化数据库 , 其中包含了20000多物体类别 , 共计约1400万张图像 , 是计算机视觉领域最具权威的数据集之一 。
- – 模型训练与结果
文章图片
(2)基于PASCAL VOC和MS COCO数据集的目标检测模型训练
由训练的结果可以看到 , 在数据量不大的CIFAR-10上的分类模型训练 , 当batch设置为5000的时候 , 仅仅只花费了7分钟的时间 。 在大型数据集ImageNet上 , batch同样设置为5000的时候 , 也只花费了3.5个小时 。 当然这个准确率可能不太高 , 但本次实验主要希望得到的是HP Z8 G4工作站的模型训练能力 , 即计算能力 , 而不是算法的好坏 。
- – 模型介绍与数据集介绍
在本次的试验中 , 我选择了目标检测领域经典的网络模型YOLOv3 , 并将使用它分别在PASCAL VOC和 MS COCO数据集上进行检测模型的训练 。
PASCAL VOC和MS COCO都是目标检测领域比较常用的数据集 。 同时在使用PASCAL VOC数据集的时候 , 我同时选用了PASCAL VOC 2007和PASCAL VOC 2012并将其合并 , 包含了20类物体 , 共计约16万张训练数据 , 2G图像数据 。 而MS COCO比PASCAL VOC的数据更加复杂 , 其中包含了91个物体类别 , 共计约有20G的图像数据 。
- – 模型训练与结果
文章图片
三、总结 通过训练的结果来看 , YOLOv3在较小的PASCAL VOC数据集上训练50020轮的时候 , 只需要花费5个小时的时间 。 在具有20G图像数据的MS COCO上训练50020轮的时候 , 需要花费34个小时 , 相当于1.5天 , 时间相对来说还是比较长的 。 不过因为本次训练只是看模型训练的能力 , 因此整体的训练效率还是比较高的 。
推荐阅读
- 研究|给AI一张高清照片,分分钟还你细节满满的3D人体模型
- 生物|超会玩!河北一高中开设手工泥巴课 学生用粘土捏出细胞模型
- 营销|阿里创新智能营销平台螺旋增长模型拆解:流量、效率、效果
- 乳房|女性乳房模型带乳晕催乳师培训道具义乳模型-宸博
- 禹唐|体育营销看禹唐 I 构建全新的体育商业模型
- 周信宏|中国惠普副总裁周信宏:战系列新品全面赋能创业者
- 创业|惠普推出战66四代商务笔记本
- 模型|看图说话最强“王者”?微软发布最新机器学习模型,助视障人士“冲浪”网络
- 模型|张萌签人都签到快本了?嘉宾真性情回复何炅都救不了场!
- 模型预测|新冠病毒感染预测模型预计到明年2月美国死亡人数将增加近80%
