游龙战神|PandaSQL:通过SQL语句进行pandas的操作的包( 二 )


警告虽然PandaSQL函数允许我们在我们的panda数据框架上运行SQL查询 , 并且在某些情况下是一个非常好的工具 , 但是它的性能不如纯panda语法 。
游龙战神|PandaSQL:通过SQL语句进行pandas的操作的包
游龙战神|PandaSQL:通过SQL语句进行pandas的操作的包当我们用可读性更强的PandaSQL为pandas计时时 , 我们发现PandaSQL花费的时间大约是原生pandas的10倍 。
结论虽然PandaSQL库的性能不如本地的panda , 但当我们想进行特别分析时 , 它是对我们的数据分析工具箱的一个很好的补充 , 而且对于那些更习惯使用SQL查询的人来说 。
想要更深入地了解这篇文章的代码 , 请访问我的GitHub知识库 , 在那里你可以找到这篇文章和我所有的文章的代码 。
【游龙战神|PandaSQL:通过SQL语句进行pandas的操作的包】github/MLWhiz/datascienceblogs/tree/master/pandasql
译者注:我一直在寻找能够使用sql处理pandas的dataframe的解决方案 , pandasSQL在这这方面起到了很好的开端 , 虽然他的性能还不足以在生产环境中使用 , 但是我们再进行EDA和数据分析等一次性的操作的时候完全可以使用sql替代复杂的pandas的查询语法 。 所以如果你跟我一样 , 对SQL非常熟悉 , 并且厌倦了pandas的复杂语法 , pandasSQL是一个很好的解决方案
作者:Rahul Agarwal
deephub翻译组


推荐阅读