[Python]战“疫”期，阿里云云效团队在家高效开发实录( 二 ) |阿里云计算|算法

随着深度学习的流行，用来加速数据科学的新的硬件层出不穷，这其中最常见的就是 GPU ，在深度学习前序流程中进行数据处理，我们是不是也能用上 GPU 来加速呢？

这几个库的操作都是命令式的（imperative），和命令式相对应的就是声明式（declarative）。命令式的更关心 how to do ，每一个操作都会立即得到结果，方便对结果进行探索，优点是很灵活；缺点则是中间过程可能占用大量内存，不能及时释放，而且每个操作之间就被割裂了，没有办法做算子融合来提升性能；那相对应的声明式就刚好相反，它更关心 what to do ，它只关心结果是什么，中间怎么做并没有这么关心，典型的声明式像 SQL、TensorFlow 1.x ，声明式可以等用户真正需要结果的时候才去执行，也就是 lazy evaluation ，这中间过程就可以做大量的优化，因此性能上也会有更好的表现，缺点自然也就是命令式的优点，它不够灵活，调试起来比较困难。

为了解决这几个问题， Mars 被我们开发出来， Mars 在 MaxCompute 团队内部诞生，它的主要目标就是让 Numpy、pandas 和 scikit-learn 等数据科学的库能够并行和分布式执行，充分利用多核和新的硬件。
Mars 的开发过程中，我们核心关注的几点包括：

我们希望 Mars 足够简单，只要会用 Numpy、pandas 或 scikit-learn 就会用 Mars 。
避免重复造轮子，我们希望能利用到这些库已有的成果，只需要能让他们被调度到多核/多机上即可。
声明式和命令式兼得，用户可以在这两者之间自由选择，灵活度和性能兼而有之。
足够健壮，生产可用，能应付各种 failover 的情况。

当然这些是我们的目标，也是我们一直努力的方向。
Mars tensor：Numpy 的并行和分布式加速器上面说过，我们的目标之一是，只要会用 Numpy 等数据科学包，就会用 Mars 。我们直接来看代码，还是以蒙特卡洛为例。变成 Mars 的代码是什么样子呢？

import mars.tensor as mtN = 10 ** 10data = http://news.hoteastday.com/a/mt.random.uniform(-1, 1, size=(N, 2))inside = (mt.sqrt((data ** 2).sum(axis=1)) < 1).sum()pi = (4 * inside / N).execute()print('pi: %.5f' % pi)

可以看到，区别就只有两处：import numpy as np 变成 import mars.tensor as mt，后续的 np. 都变成 mt. ；pi 在打印之前调用了一下 .execute() 方法。
也就是默认情况下， Mars 会按照声明式的方式，代码本身移植的代价极低，而在真正需要一个数据的时候，通过 .execute() 去触发执行。这样能最大限度得优化性能，以及减少中间过程内存消耗。
这里，我们还将数据的规模扩大了 1000 倍，来到了 100 亿个点。之前 1/1000 的数据量的时候，在我的笔记本上需要 757ms；而现在数据扩大一千倍，光 data 就需要 150G 的内存，这用 Numpy 本身根本无法完成。而使用 Mars ，计算时间只需要 3min 44s ，而峰值内存只需要 1G 左右。假设我们认为内存无限大， Numpy 需要的时间也就是之前的 1000 倍，大概是 12min 多，可以看到 Mars 充分利用了多核的能力，并且通过声明式的方式，极大减少了中间内存占用。
前面说到，我们试图让声明式和命令式兼得，而使用命令式的风格，只需要在代码的开始配置一个选项即可。

import mars.tensor as mtfrom mars.config import optionsoptions.eager_mode = True# 打开 eager mode 后 ， 每一次调用都会立即执行 ， 行为和 Numpy 就完全一致N = 10 ** 7data = http://news.hoteastday.com/a/mt.random.uniform(-1, 1, size=(N, 2))inside = (mt.linalg.norm(data, axis=1) 
上一页
1
2
3
4
5
下一页
		  	






























推荐阅读

           
                  
              
                  中国人民公安大学|中国人民公安大学2020年本科生录取名单 
                
                   
                
              
            

                  
              
                  徐渭：一生自杀9次的大明才子，你不知道他一生有多牛 
                
                   
                
              
            

                  
              
                  心房颤动的原因 
                
                   
                
              
            

                  
              
                  39岁前TVB小生现身内地摆摊卖鸡脚，被网友提及旧爱陈自瑶 
                
                   
                
              
            

                  
              
                  荣达衣柜100年来的投资政策和加盟支持详细分析 
                
                   
                
              
            

                  
              
                  中青在线|【青声视语】中国经济“转正”，众多外媒这样说…… 
                
                   
                
              
            

                  
              
                  |为何在高考前，很多家长都让孩子喝酒？看完长见识了 
                
                   
                
              
            

                  
              
                  惊弓之鸟的主人公故事 惊弓之鸟的主人公是谁 
                
                   
                
              
            

                  
              
                  幽默段子手|排在前面的女孩背影很迷人，开心一刻笑话：今天在手机营业厅充值 
                
                   
                
              
            

                  
              
                  桐皮薏仁酒的功效与作用 
                
                   
                
              
            

                  
              
                  金融|车险综合改革来了 交强险总责任限额提高到20万元 
                
                   
                
              
            

                  
              
                  股价|严重超跌的小金属概念：产能全国第一，军工市占率超过80% 
                
                   
                
              
            

                  
              
                  端午节的礼仪有哪些 端午节习俗礼仪 
                
                   
                
              
            

                  
              
                  环球网|南非开普敦一海滨地区被厚厚的白色泡沫覆盖 
                
                   
                
              
            

                  
              
                  封面新闻|动物体内育器官、人造皮肤变手机……这些科学突破正改变你的未来 
                
                   
                
              
            

                  
              
                  法海妈妈幼教|培养高情商娃，孩子出口伤人只是“童言无忌”？教会孩子好好说话 
                
                   
                
              
            

                  
              
                   蛋白质|冬天进补，鸡鸭鱼肉靠边站，这肉是贵了一点，但再穷也要给孩子吃 
                
                   
                
              
            

                  
              
                  直播吧|迪马：拉齐奥1800万欧报价费内巴切前锋V-穆里奇 
                
                   
                
              
            

                  
              
                  进击DE氪星人TB|梅西2传1射助球队继续领跑积分榜，巴塞罗那复赛首秀大胜 
                
                   
                
              
            

                  
              
                  「孕妇」孕妇生孩子需要准备什么东西 
                
                   
                
              
            

          

畜牧业@畜牧互联网再次引爆：阿里养猪，京东养鸡，快看大佬们都在干嘛 

『腾讯科技』淘宝天猫蒋凡在阿里内网回应传闻：深表歉意，恳请公司展开调查 

#阿里巴巴#将饿了么卖给阿里，套现600亿的大学生，如今在干什么呢？ 

服务@云市场跨步式发展 打造ToB云市场阿里腾讯外“第三股势力” 

『程序员』阿里程序员感慨：公司期权套牢了我，外面开五六万的薪资都不想接 

「创作者来直播」阿里老师给检察官做直播，猜猜带的什么货？ 

■奶奶大学同学让我别学Python了，吃枣药丸，劝我学汇编，说是时髦 

『湘潭』华为、京东、阿里云……湘潭欲打造的这个“英雄联盟”很是“牛” 

「程序员小助手」奶奶大学同学让我别学Python了，吃枣药丸，劝我学汇编，说是时髦 

#新开普#阿里系进驻后股价翻倍，这家豫股却遭大股东减持套现63次丨立方财报眼