中年|10 个加速python数据分析的简单小技巧( 二 )


使用
#importing Pandasimport pandas as pd#importing plotly and cufflinks in offline modeimport cufflinks as cfimport plotly.offlinecf.go_offline()cf.set_config_file(offline=False, world_readable=True)
是时候用 Titanic 数据集来展示它的魔法了 。
df.iplot()
中年|10 个加速python数据分析的简单小技巧
本文插图

df.iplot() vs df.plot()
右视图显示的是静态图表 , 左图表是交互式的 , 更详细地说 , 所有这一切在语法上都没有重大变化 。
3.一点点 Magic

Magic 命令是 Jupyter notebook 中的一组方便的函数 , 旨在解决标准数据分析中的一些常见问题 。 在%lsmagic 的帮助下 , 您可以看到所有可用的 magic 。
中年|10 个加速python数据分析的简单小技巧
本文插图

所有可用的 magic 函数列表
magic 命令有两种:行 magics(前缀为一个% 字符并在一行输入上操作)和单元 magics(用%% 前缀关联并在多行输入上操作) 。 如果设置为 1 , 则可以调用 magic 函数 , 而无需键入初始百分比 。
让我们看看其中一些在常见数据分析任务中可能有用的功能:
% pastebin
%Pastebin 将代码上载到 Pastebin 并返回 URL 。 Pastebin 是一种在线内容托管服务 , 我们可以在其中存储纯文本(如源代码片段) , 然后可以与其他人共享 URL 。 事实上 , Github gist 也类似于 Pastebin , 尽管有版本控制 。
考虑使用包含以下内容的 python script file.py:
#file.pydef foo(x):return x
使用 Jupyter notebook 中的%pastebin 生成 pastebin url
中年|10 个加速python数据分析的简单小技巧
本文插图

%matplotlib notebook
%matplotlib inline 函数用于呈现 Jupyter noteboo 中的静态 matplotlib 绘图 。 尝试用 notebook 替换内嵌部件 , 以轻松获得可缩放和可调整大小的绘图 。 确保在导入 Matplotlib 库之前调用了函数 。

中年|10 个加速python数据分析的简单小技巧
本文插图

%matplotlib inline vs %matplotlib notebook

  • %run
%run 函数在 notebook 内运行 python 脚本 。
%run file.py
  • %%writefile
%WriteFile 将单元格的内容写入文件 。 在这里 , 代码将被写入一个名为 foo 的文件 , 并保存在当前目录中 。
中年|10 个加速python数据分析的简单小技巧
本文插图

  • %%latex
%%latex 函数将单元格内容呈现为 LaTeX 。 它可用于在单元中编写数学公式和方程 。
中年|10 个加速python数据分析的简单小技巧
本文插图

4.发现和消除错误
interactive debugger 也是一个神奇的函数 , 但我已经为它提供了自己的一个类别 。 如果在运行代码单元时遇到异常 , 请在新行中键入%debug 并运行它 。 这将打开一个交互式调试环境 , 将您带到发生异常的位置 。 您还可以检查程序中分配的变量值 , 并在此处执行操作 。 要退出调试器 , 请单击 q 。
中年|10 个加速python数据分析的简单小技巧
本文插图

5.输出也可以很漂亮
如果您想为数据结构生成美观的表示 , pprint 是你想要的模块 , 它在打印字典或 JSON 数据时特别有用 。 让我们来看一个使用 print 和 pprint 显示输出的示例 。


推荐阅读