「科技排头」莱斯大学&英特尔新算法证明CPU加速深度学习优于GPU!老黄核弹警告鱼羊发自凹非寺量子位报道|公众号QbitA

鱼羊发自凹非寺量子位报道|公众号QbitAI
实验室一块GPU都没有怎么做深度学习？

文章图片
如果让莱斯大学和英特尔的研究人员来回答，答案大概是：用CPU啊。
莱斯大学和英特尔的最新研究证明，无需专门的加速硬件（如GPU），也可以加速深度学习。
算法名为SLIDE 。
研究人员称， SLIDE是第一个基于CPU的深度学习智能算法，并且，在具有大型全连接架构的行业级推荐数据集上， SLIDE训练深度神经网络的速度甚至超过了GPU 。
代码已开源。
基于局部敏感哈希
摆脱GPU的核心思想，是利用局部敏感哈希来摆脱矩阵乘法。

文章图片
代码采用C++编写。
论文一作BeidiChen介绍：
基于TensorFlow和PyTorch来实现SLIDE算法是没有意义的，因为那必须把问题转换成矩阵乘法问题，而这一点恰恰是我们想要摆脱的。
在架构上， SLIDE的中心模块是神经网络。网络的每个层模块由神经元和一些哈希表组成，神经元ID被哈希到其中。

文章图片
每个神经元模块都包含：
一个二进制数组，提示该神经元是否对于batch中的每一个输入都有效batch中的每一个输入的activationbatch中每个输入的累积梯度与上一层的连接权重最后一个数组的长度等于上一层中神经元的数量。
每层中的LSH哈希表构造都是一次性操作，可以与该层中不同神经元上的多个线程并行。
论文作者之一、莱斯大学助理教授AnshumaliShrivastava表示， SLIDE相对于反向传播的最大优势就在于数据并行。
举个例子，数据并行的情况下，要训练两个数据实例，一个是猫的图像，另一个是公共汽车的图像，它们可能会激活不同的神经元，而SLIDE可以分别独立地更新、训练它们。
如此，就能更好地利用CPU的并行性。
不过，与GPU相比，该方法对内存要求较高。
Shrivastava也提到，在与英特尔的合作中，他们针对SLIDE ，对CPU进行了优化，比如支持KernelHugepages以减少缓存丢失。这些优化使得SLIDE的性能提高了约30% 。
实验结果
所以，与依赖GPU的深度学习相比， SLIDE到底表现如何？
研究人员在Delicious-200K和Amazon-670K这两个大型数据集上进行了验证。
实验配置，是2个22核/44线程处理器（IntelXeonE5-2699Av42.40GHz），和英伟达TeslaV100Volta32GBGPU 。
结果表明，在任意精度上， CPU上的SLIDE总是比V100上基于TensorFlow的GPU算法快。

文章图片
在Delicious-200K数据集上， SLIDE比TF-GPU快1.8倍；而在算力要求更高的Amazon-670K数据集上， SLIDE的速度更是TF-GPU的2.7倍。
其大部分计算优势，来自于对输出层中一小部分激活神经元的采样。
而在相同的CPU上， SLIDE要比基于TensorFlow的算法快10倍以上。

文章图片
网友：英特尔的广告？
在CPU上跑深度学习能快过GPU ，这样的结论立刻吸引住了网友们的目光。
有网友分析说：
该方法不仅使用了哈希表，其速度之快还得归功于OpenMP的硬件多核优化。（OpenMP是一套支持跨平台共享内存方式的多线程并发的编程API）
看起来在小型DNN中是非常有前途的替代方案。不过，问题在于，该方法是否可以推广到其他CPU架构中？这种方法中还是存在巨大的冲突和牺牲准确性的风险。

「科技排头」莱斯大学&英特尔新算法证明CPU加速深度学习优于GPU!老黄核弹警告

推荐阅读

奇迹中国|普京：俄美都要克制！

淘宝品销宝入口在哪里天猫品销宝位置在哪里

[任正非]孟晚舟连线谈感受，任正非觉得对不起女儿，一度哽咽。

[立马耳语]一面渐变小清新，另一面是狂野“大熊皮”！，傅菁的造型真是绝了

时尚春娇|想升职加薪要改正，为什么领导不喜欢你？看看这四点你有没有犯错

高校@读专科有前途吗？对于没考上大学的女孩子来说有什么好的专业呢？

AI电堂|机器学习算法大解析，人工智能凭借什么过关斩将？|

杭州市人民检察院依法批准逮捕犯罪嫌疑人许国利

慕容沁伶|盘点明星们刚出道的样子：沈梦辰判若两人，蔡徐坤皮肤黑还龅牙！

Cdr怎么画半圆，cdr应该怎么样才能画半圆

华为荣耀|从3899跌至2659，华为高端旗舰跌成中端价格，未来还能升级鸿蒙2.0

「」孕妇能吃花椒油

搜狐时尚快讯|LA MER海蓝之谜鎏金焕颜夜间修护霜奢耀上市众明星亲临现场

[OPPO]OPPO Ace2重磅来袭：骁龙865+LPDDR5 12GB+UFS 3.0

『茶苏苏私房志』鸡胸肉别再水煮啦，换个做法，香到手指都要吮一遍！

老冀说科技▲海外市场如何重启？，华为P40全线预装HMS

权益类理财产品上升助力银行转型实现多赢发展

新水浒传鲁智深?水浒人物鲁智深_3

创业板指|浙江这个街道办招8人全是北大清华研究生网友炸了！

荷花茶的功效与作用,详谈关于芍药花茶基本的功效与作用

「科技排头」莱斯大学&amp;英特尔新算法证明CPU加速深度学习优于GPU!老黄核弹警告

推荐阅读

「科技排头」莱斯大学&英特尔新算法证明CPU加速深度学习优于GPU!老黄核弹警告