科技排头 用Windows电脑训练深度学习模型?超详细配置教程来了

选自towardsdatascience
作者:Ahinand
机器之心编译
编辑:Panda
虽然大多数深度学习模型都是在Linux系统上训练的 , 但Windows也是一个非常重要的系统 , 也可能是很多机器学习初学者更为熟悉的系统 。 要在Windows上开发模型 , 首先当然是配置开发环境 。 KaggleMaster及机器学习实践者Abhinand立足于自己的实践 , 给出了一种简单易行的Windows深度学习环境配置流程 。
本文将介绍在Windows计算机上配置深度学习环境的全过程 , 其中涉及安装所需的工具和驱动软件 。 出人意料的是 , 即便只是配置深度学习环境 , 任务也不轻松 。 你很有可能在这个过程中犯错 。 我个人已经很多次从头开始配置深度学习环境了 , 但是通常是在对程序员更友好的操作系统Linux中 。
而对于Windows操作系统 , 没有多少文章详细解释这一过程 。 所以我打算自己来试试 。 这些天 , 经过多次试错之后 , 我终于找到了解决方案 。 这个方法不仅能够配置成功 , 还比我见过的其它教程简单得多 。
本教程为谁而写 , 以及为什么要用Windows?
相信我 , 我自己也不喜欢在Windows上鼓捣CUDA 。 但我们常常遇到这种情况:开发者经常需要在并非深度学习或程序开发专用的笔记本电脑或更强大的硬件上工作 。 在这种情况下 , 你并不总能避免使用Windows 。 如果你遇到这种情况 , 或者正好拥有一台Windows计算机 , 又或者还不能熟练使用Linux , 那么这份指南肯定能帮到你 。
本文包含以下内容:
硬件和软件的最低要求
安装Python和所需工具
设置开发环境
一些GPU术语
安装GPU驱动
安装TensorFlow(CPU和GPU)
安装PyTorch(CPU和GPU)
验证安装情况
我的个人经验和替代方法
硬件和软件的最低要求
如果你要按照本指南操作并且计划使用GPU , 你必须使用英伟达GPU 。
开发深度学习应用涉及到训练神经网络 , 这自然需要执行大量计算 。 也因此 , 我们需要越来越多的并行运算 , 而GPU正好能够满足我们的需求 。 这也是当前GPU需求旺盛的主要原因之一 。 大多数深度学习框架都自带GPU加速支持 , 这让开发者和研究者无需执行任何GPU编程就能在几分钟内使用GPU进行计算 。
大部分这些框架都(只)支持CUDA , 而这只能在英伟达GPU上使用 , 这也是你需要使用英伟达GPU的原因 。 但是 , 使用AMD的GPU也不是不可能 , 相关信息可参阅:https://rocmdocs.amd.com/en/latest/ 。
不过 , 就算你没有GPU , 也依然可以继续本教程 。 但为了有效进行深度学习 , 至少你要有好用的CPU、内存和存储空间 。
我的硬件——笔记本电脑的配置如下:
CPU——AMDRyzen74800HS8C-16T@4.2GHzonTurbo
RAM——16GBDDR4RAM@3200MHz
GPU——NvidiaGeForceRTX2060Max-Q@6GBGDDR6显存
对于硬件配置 , 我推荐至少使用4核2.6GHz的CPU、16GB内存和6GB显存的英伟达GPU 。
另外 , 对于本教程 , 你当然需要使用Windows10系统 。 我也假设你对Python软件包和环境具备基本认知 。 不管怎样 , 后面都会给出解释 。
推荐使用的Windows版本是最新的64位Windows10稳定版 。
本教程假设你的操作系统是刚装好的 , 没有执行过额外的修改 。 不过只要你知道自己在做什么 , 依然可以参考本教程 。
安装Python和所需工具
第一步当然是安装Python 。 我建议使用Mini-Conda来安装Python 。 先给刚入门的新手解释一下原因 。
Conda是一个软件包管理工具 , 可以帮助你安装、管理和移除各种不同的软件包 。 不过Conda并不是唯一的选择 , 还有pip——这是我很喜欢的Python默认软件包管理工具 。 这里我们选择Conda的原因是在Windows上使用它更简单直接 。
Anaconda和Mini-Conda都是Conda的软件发行版 , 其中预安装了一些非常有用的数据科学/机器学习软件包 , 能节省很多时间 。 Anaconda包含150多个在数据科学和机器学习中有用的软件包 , 基本上包含了你可能需要的一切 , 而Mini-Conda仅包含一些必需的工具和软件包 。


推荐阅读