中国统计网Python实战案例:我们对共享单车的需求有多大?( 二 )
本文插图
本文插图
可视化分析1. 日期和总租赁数量
本文插图
2012年相比2011年租赁数量有所增长, 且波动幅度相类似 。
本文插图
【中国统计网Python实战案例:我们对共享单车的需求有多大?】
2. 月份和总租赁数量
与上图的波动幅度基本一致, 另外每个月均有不同程度的离群值 。
本文插图
3. 季节和总租赁数量
就中位数来说, 秋季是最多的, 春季最少且离群值较多 。
4. 星期几和租赁数量
本文插图
就中位数来说, 未注册用户周六和周日较多, 而注册用户则周内较多, 对应的总数也是周内较多, 且周内在总数的离群值较多(0代表周一, 6代表周日)
本文插图
5. 节假日, 工作日和总租赁数量
本文插图
- 未注册用户:在节假日较多, 在工作日较少
- 注册用户:在节假日较少, 在工作日较多
本文插图
6. 小时和总租赁数量的关系
本文插图
- 在节假日, 未注册用户和注册用户走势相接近, 不过未注册用户最高峰在14点, 而注册用户则是17点
- 在工作日, 注册用户呈现出双峰走势, 在8点和17点均为用车高峰期, 而这正是上下班或者上下学高峰期
- 对于注册用户来说, 17点在节假日和工作日均为高峰期, 说明部分用户在节假日可能未必休假
本文插图
7. 天气和总租赁数量
就中位数而言未注册用户和注册用户均表现为: 在工作日和非工作日租赁数量均随着天气的恶劣而减少, 特别地, 当天气为大雨大雪天(4)且非工作日均没有自行车租赁 。
本文插图
从图上可以看出, 大雨大雪天只有一个数据, 我们看看原数据 。
df[df.weather==4]只有在2012年1月9日18时为大雨大雪天, 说明天气是突然变化的, 部分用户可能因为没有看天气预报而租赁自行车, 当然也有其他原因 。另外, 发现1月份是春季, 看看它的季节划分规则 。
sns.boxplot(x='season', y='month',data=http://news.hoteastday.com/a/df)123为春季, 456为夏季, 789为秋季...季节的划分通常和纬度相关, 而这份数据是用来预测美国华盛顿的租赁数量, 且美国和我国的纬度基本一样, 故按照345春节, 678夏季..这个规则来重新划分 。
推荐阅读
- 楠竹一|墙头草国家曾被苏联灭国,如今让中国损失478,比土耳其还厚脸皮
- 【】中国十大忙碌城市出炉:前三不是北上广!来看看有你家吗?
- 枫叶说体育|专利如今过期了,结果怎样了?,中国小伙发明“U盘”获利几十亿
- 基金|中芯国际发行价为27.52元 中国信科和国家集成电路基金参与
- 阿拉图图科技说三星新机口碑虽好,但中国市场销量翻车,用户几乎跑光!
- 驱动中国无缘屏下摄像头!华为Mate 40系列爆料:双曲面设计
- 驱动中国腾讯内部人士爆料:与“老干妈”合作多个环节有漏洞 却无人察觉
- 驱动中国首发AMD锐龙9处理器 华硕天选游戏本元气蓝开箱图赏
- 文汇网AI力量大集结!中国团队首次在国际顶级学术期刊发布中国AI全景论文
- 中国新闻网|日本东京都知事选举结束 日媒:小池百合子确定胜选
