[Python]战“疫”期,阿里云云效团队在家高效开发实录( 五 )


Join 测试查询:
x = read_csv('x.csv')y = read_csv('y.csv')x.merge(y, on='id1') 测试数据 x 为500M , y 包含10行数据 。
[Python]战“疫”期,阿里云云效团队在家高效开发实录
本文插图

总结 RAPIDS 将 Python 数据科学带到了 GPU , 极大提升了数据分析和处理的效率 。 Mars 的注意力更多放在并行和分布式 。 相信这两者的结合 , 在未来会有更多的想象空间 。


推荐阅读