中国统计网Python实战案例:我们对共享单车的需求有多大?( 二 )


本文插图
中国统计网Python实战案例:我们对共享单车的需求有多大?
本文插图
可视化分析1. 日期和总租赁数量
中国统计网Python实战案例:我们对共享单车的需求有多大?
本文插图
2012年相比2011年租赁数量有所增长, 且波动幅度相类似 。
中国统计网Python实战案例:我们对共享单车的需求有多大?
本文插图
【中国统计网Python实战案例:我们对共享单车的需求有多大?】
2. 月份和总租赁数量
与上图的波动幅度基本一致, 另外每个月均有不同程度的离群值 。
中国统计网Python实战案例:我们对共享单车的需求有多大?
本文插图
3. 季节和总租赁数量
就中位数来说, 秋季是最多的, 春季最少且离群值较多 。
4. 星期几和租赁数量
中国统计网Python实战案例:我们对共享单车的需求有多大?
本文插图
就中位数来说, 未注册用户周六和周日较多, 而注册用户则周内较多, 对应的总数也是周内较多, 且周内在总数的离群值较多(0代表周一, 6代表周日)
中国统计网Python实战案例:我们对共享单车的需求有多大?
本文插图
5. 节假日, 工作日和总租赁数量
中国统计网Python实战案例:我们对共享单车的需求有多大?
本文插图

  • 未注册用户:在节假日较多, 在工作日较少
  • 注册用户:在节假日较少, 在工作日较多
总的来说,节假日租赁较少, 工作日租赁较多,初步猜测多数未注册用户租赁自行车是用来非工作日出游, 而多数注册用户则是工作日用来上班或者上学 。
中国统计网Python实战案例:我们对共享单车的需求有多大?
本文插图
6. 小时和总租赁数量的关系
中国统计网Python实战案例:我们对共享单车的需求有多大?
本文插图
  • 在节假日, 未注册用户和注册用户走势相接近, 不过未注册用户最高峰在14点, 而注册用户则是17点
  • 在工作日, 注册用户呈现出双峰走势, 在8点和17点均为用车高峰期, 而这正是上下班或者上下学高峰期
  • 对于注册用户来说, 17点在节假日和工作日均为高峰期, 说明部分用户在节假日可能未必休假

中国统计网Python实战案例:我们对共享单车的需求有多大?
本文插图
7. 天气和总租赁数量
就中位数而言未注册用户和注册用户均表现为: 在工作日和非工作日租赁数量均随着天气的恶劣而减少, 特别地, 当天气为大雨大雪天(4)且非工作日均没有自行车租赁 。
中国统计网Python实战案例:我们对共享单车的需求有多大?
本文插图
从图上可以看出, 大雨大雪天只有一个数据, 我们看看原数据 。
df[df.weather==4]只有在2012年1月9日18时为大雨大雪天, 说明天气是突然变化的, 部分用户可能因为没有看天气预报而租赁自行车, 当然也有其他原因 。
另外, 发现1月份是春季, 看看它的季节划分规则 。
sns.boxplot(x='season', y='month',data=http://news.hoteastday.com/a/df)123为春季, 456为夏季, 789为秋季...
季节的划分通常和纬度相关, 而这份数据是用来预测美国华盛顿的租赁数量, 且美国和我国的纬度基本一样, 故按照345春节, 678夏季..这个规则来重新划分 。
中国统计网Python实战案例:我们对共享单车的需求有多大?


推荐阅读