数据:2017年5月两周内,北京40余万辆摩拜单车被30余万摩拜用户的使用情况(该开源数据来源于2017年摩拜算法挑战赛)。数据包含300余万条出行记录数据,每条的数据包含了订单号(orderid )、用户编号(userid )、单车编号(bikeid)、单车类(biketype)、开始使用单车时间(starttime)、使用起点坐标(startloc)和使用终点坐标(endloc),其中起点和终点坐标经过了geohash加密(数据考虑到各方面原因,就不放出来了)

代码:

# -*- coding: utf-8 -*-
"""
Spyder EditorThis is a temporary script file.
"""import pandas as pd
import geohash#读取
data=pd.read_csv(r'mobike_train_data.csv',sep=',')#日期格式处理
data.starttime=data.starttime.astype('str')
data.starttime=pd.to_datetime(data.starttime,format='%Y-%m-%d %H:%M:%S')
data=data.dropna()#缺失值删除#geohash解码
data["start_lat_lng"] = data["geohashed_start_loc"].apply(lambda s: geohash.decode(s))
data["end_lat_lng"] = data["geohashed_end_loc"].apply(lambda s: geohash.decode(s))#筛选14-24号的数据
data_14=data.loc[data.starttime<='2017-05-14 23:59:59']
data_15=data.loc[(data.starttime<='2017-05-15 23:59:59')&(data.starttime>'2017-05-14 23:59:59')]
data_16=data.loc[(data.starttime<='2017-05-16 23:59:59')&(data.starttime>'2017-05-15 23:59:59')]
#data_17=data.loc[(data.starttime<='2017-05-17 23:59:59')&(data.starttime>'2017-05-16 23:59:59')]
#17号数据是空的
data_18=data.loc[(data.starttime<='2017-05-18 23:59:59')&(data.starttime>'2017-05-17 23:59:59')]
data_19=data.loc[(data.starttime<='2017-05-19 23:59:59')&(data.starttime>'2017-05-18 23:59:59')]
data_20=data.loc[(data.starttime<='2017-05-20 23:59:59')&(data.starttime>'2017-05-19 23:59:59')]
data_21=data.loc[(data.starttime<='2017-05-21 23:59:59')&(data.starttime>'2017-05-20 23:59:59')]
data_22=data.loc[(data.starttime<='2017-05-22 23:59:59')&(data.starttime>'2017-05-21 23:59:59')]
data_23=data.loc[(data.starttime<='2017-05-23 23:59:59')&(data.starttime>'2017-05-22 23:59:59')]
data_24=data.loc[(data.starttime<='2017-05-24 23:59:59')&(data.starttime>'2017-05-23 23:59:59')]#统计14号数据
bike_count_14=data_14['bikeid'].value_counts()
user_count_14=data_14['userid'].value_counts()#时间分区间统计
bin=pd.date_range(start='2017-05-14 00:00:00',end='2017-05-15 00:00:00',freq='0.5H')
data_scattertime=pd.cut(data_14['starttime'],bin)
scattertime_count=data_scattertime.value_counts(sort=False)
scattertime_count.plot(kind='line')

14号的分时间段的订单量结果图:

膜拜共享单车数据分析相关推荐

  1. sql date类型_共享单车数据分析的SQL数据库设计

    SQL,发音为" sequel"(或SQL,如果愿意的话),是数据科学家的重要工具.实际上,它可以说是获取数据工作中最重要的语言.在共享单车数据分析的SQL设计中,我们将从入门者的 ...

  2. 摩拜共享单车数据分析项目报告

    文章目录 项目背景 数据探索 数据挖掘 数据分析 时间维度 空间维度 用户维度 项目背景 随着智能手机的普及和手机用户的激增,共享单车作为城市交通系统的一个重要组成部分,以绿色环保.便捷高效.经济环保 ...

  3. 毕业设计 题目:基于大数据的共享单车数据分析

    文章目录 0 前言 1 项目背景 2 项目分析思维导图 3 项目分析具体步骤 3.1 读取数据 3.2 数据分析 3.1.1 数据预处理--每日使用量分析 3.1.2 连续7天的单日使用分析结论 3. ...

  4. 共享单车数据分析的SQL数据库设计

    SQL,发音为" sequel"(或SQL,如果愿意的话),是数据科学家的重要工具.实际上,它可以说是获取数据工作中最重要的语言.在共享单车数据分析的SQL设计中,我们将从入门者的 ...

  5. kaggle共享单车数据分析及预测(随机森林)

    文章目录 一.数据收集 1.1.项目说明 1.2.数据内容及变量说明 二.数据处理 2.1.导入数据 2.2.缺失值处理 2.3.Label数据(即count)异常值处理 2.4.其他数据异常值处理 ...

  6. Spark SQL上海摩拜共享单车数据分析

    1 生成DataFrame对象 val bikeDF = sqlContext.read.format("csv").option("header", &quo ...

  7. 美国共享单车数据分析

    分析三大美国城市的自行车共享系统相关的数据:芝加哥.纽约和华盛顿特区.写一个脚本,该脚本会接受原始输入并在终端中创建交互式体验,以展现这些统计信息. 目录 数据集说明: 起始时间分析: 骑行时长分析: ...

  8. 毕业设计 基于大数据的共享单车数据分析与可视化

    文章目录 0 前言 1 课题背景 2 数据清洗 3 数据可视化 热力图 整体特征分布 **查看2011-2012间的单车租借情况** 天气对于租借数量的影响 湿度与温度对于租借数量的影响 注册用户与未 ...

  9. python共享单车数据分析_数据分析_共享单车骑行时间分析-zeropython

    数据分析一共分为五个任务: 第一步:明确分析的任务 分析出每个季度的骑行的平均时长和各个季度的对比 第二步:数据处理 先看数据: shell 查看csv 数据前十行 ➜ data cat bikesh ...

最新文章

  1. python自学需要多久-自学Python多久能找到工作
  2. 【图像分类】 图像分类中的对抗攻击是怎么回事?
  3. 2018-2019-1 20165237 《信息安全系统设计基础》第四周学习总结
  4. 下一清分日期是几年前_下一清分日期是什么意思
  5. 【数据结构与算法】之深入解析“水壶问题”的求解思路与算法示例
  6. 牛客练习赛43 Tachibana Kanade Loves Probability(快速幂)
  7. async await实例
  8. 2018.09.15 vijos1053Easy sssp(最短路)
  9. jmeter远程启动命令_Jmeter命令行方式启动
  10. 又一起删库跑路事件!宕机36小时、损失近10亿,腾讯云还差点背锅...
  11. JavaScript-箭头函数
  12. 蓝桥杯第十三届省赛题目(4月23日)答案汇总 python
  13. 电子科学与技术毕业论文题目【452个】
  14. Linux ERROR: configuration failed for package ‘rgeos’
  15. matlab rtw 生成c代码,MATLAB Coder ——从MATLAB代码生成C/C++代码
  16. 任务栏-IDEA图标变白色
  17. 服务器win10系统开机慢,Win10系统更新后开机变得很慢的解决方法
  18. 微信全面开放个人免费版红包封面!
  19. K3ERP web登录问题解决
  20. IP 基础知识“全家桶”,45 张图一套带走

热门文章

  1. Android第三方登陆之新浪微博Weibo篇(原生登陆授权)
  2. 现在做什么生意比较赚钱,且投资小利润大?
  3. matlab模拟gpd,GPD WIN1流畅玩游戏之DOS游戏,阿猫阿狗大作战 大宇16个DOS游戏全合集...
  4. 雨晨QQ2013beta2(5865) 双显IP纯净完整自选版
  5. HT1382时钟芯片代码
  6. HTML4.01、XHTML 1.0、HTML5版本变化
  7. 诚之和:“世界第二富豪”贝索斯:20亿美金拿去花,别再骂我不管地球了
  8. 玩骰子的儿童(赫拉克利特)
  9. 计算机声卡原理,关于声卡的性能的理解
  10. 如何做好社群运营,实现私域流量转化,圈量SCRM教您一招