『可视化技术』Pandas数据可视化的9个要点「附案例」
本文插图
文末领取【数据可视化图表选择指南】
数据可视化可以让我们很直观的发现数据中隐藏的规律 , 察觉到变量之间的互动关系 , 可以帮助我们更好的给他人解释现象 , 做到一图胜千文的说明效果 。
常见的数据可视化库有:
- matplotlib 是最常见的2维库 , 可以算作可视化的必备技能库 , 由于matplotlib是比较底层的库 , api很多 , 代码学起来不太容易 。
- seaborn 是建构于matplotlib基础上 , 能满足绝大多数可视化需求 。 更特殊的需求还是需要学习matplotlib 。
- pyecharts 上面的两个库都是静态的可视化库 , 而pyecharts有很好的web兼容性 , 可以做到可视化的动态效果 。
- 数据采集 如何批量采集网页表格数据?
- 数据读取 pd.read_csv/pd.read_excel
- 数据清洗(预处理) 理解pandas中的apply和map的作用和异同
- 可视化 , 兼容matplotlib语法 (今天重点)
- 导入数据
- 绘制最简单的图plot
- 多个y的绘制图
- 折线图、条形图、饼形图和散点图绘制
- 统计信息绘图
- 箱型图
- 轴坐标刻度
- plot更多精细化参数
- 可视化结果输出保存
如果你之前没有学过pandas和matpltolib,我们先安装好这几个库
!pip3 install numpy!pip3 install pandas!pip3 install matplotlib 已经安装好 , 现在我们导入这几个要用到的库 。 使用的是伦敦天气数据 , 一开始我们只有12个月的小数据作为例子 #jupyter notebook中需要加这行代码%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npimport pandas as pd#读取天气数据df = pd.read_csv('data/london2018.csv')df本文插图
plot最简单的图
选择Month作为横坐标 , Tmax作为纵坐标 , 绘图 。
大家注意下面两种写法
#写法1df.plot(x='Month', y='Tmax')plt.show 本文插图
- 横坐标轴参数x传入的是df中的列名Month
- 纵坐标轴参数y传入的是df中的列名Tmax
上面的图就是折线图 , 折线图语法有三种
- df.plot(x='Month', y='Tmax')
- df.plot(x='Month', y='Tmax', kind='line')
- df.plot.line(x='Month', y='Tmax')
df.plot.line(x='Month', y='Tmax')plt.show本文插图
#grid绘制格线df.plot(x='Month', y='Tmax', kind='line', grid=True)plt.show
推荐阅读
- 海南师范大学海南省科学技术厅谢京厅长一行赴我校调研指导重点实验室建设工作
- SENSORO升哲科技需要物联网技术来寻找新的增长点,后疫情时代下的零售业
- 做一个有趣的灵魂【搞笑动图】您看我这无人驾驶技术可还行?
- #老玩家#王者荣耀:看职业比赛学技术?老玩家忠告:不要误入歧途
- 二台格物设计的与时俱进
- ZAKERCTP、刀片、无钴……动力电池新技术的幕后黑手是谁?
- 李先生看点技术人员都要抱着电脑睡,在珠峰海拔6500米5G基站难度非常大
- 决战东方浅谈散货船的节能设计变革,舰船技术|取消球鼻艏成为“新风潮”
- 中国财富网半导体显示技术前景广阔,134家机构调研TCL科技
- 华为■美国无奈宣告“妥协”,将采用华为5G技术,任正非果然没有说错
