膜拜共享单车数据分析
数据:2017年5月两周内,北京40余万辆摩拜单车被30余万摩拜用户的使用情况(该开源数据来源于2017年摩拜算法挑战赛)。数据包含300余万条出行记录数据,每条的数据包含了订单号(orderid )、用户编号(userid )、单车编号(bikeid)、单车类(biketype)、开始使用单车时间(starttime)、使用起点坐标(startloc)和使用终点坐标(endloc),其中起点和终点坐标经过了geohash加密(数据考虑到各方面原因,就不放出来了)
代码:
# -*- coding: utf-8 -*-
"""
Spyder EditorThis is a temporary script file.
"""import pandas as pd
import geohash#读取
data=pd.read_csv(r'mobike_train_data.csv',sep=',')#日期格式处理
data.starttime=data.starttime.astype('str')
data.starttime=pd.to_datetime(data.starttime,format='%Y-%m-%d %H:%M:%S')
data=data.dropna()#缺失值删除#geohash解码
data["start_lat_lng"] = data["geohashed_start_loc"].apply(lambda s: geohash.decode(s))
data["end_lat_lng"] = data["geohashed_end_loc"].apply(lambda s: geohash.decode(s))#筛选14-24号的数据
data_14=data.loc[data.starttime<='2017-05-14 23:59:59']
data_15=data.loc[(data.starttime<='2017-05-15 23:59:59')&(data.starttime>'2017-05-14 23:59:59')]
data_16=data.loc[(data.starttime<='2017-05-16 23:59:59')&(data.starttime>'2017-05-15 23:59:59')]
#data_17=data.loc[(data.starttime<='2017-05-17 23:59:59')&(data.starttime>'2017-05-16 23:59:59')]
#17号数据是空的
data_18=data.loc[(data.starttime<='2017-05-18 23:59:59')&(data.starttime>'2017-05-17 23:59:59')]
data_19=data.loc[(data.starttime<='2017-05-19 23:59:59')&(data.starttime>'2017-05-18 23:59:59')]
data_20=data.loc[(data.starttime<='2017-05-20 23:59:59')&(data.starttime>'2017-05-19 23:59:59')]
data_21=data.loc[(data.starttime<='2017-05-21 23:59:59')&(data.starttime>'2017-05-20 23:59:59')]
data_22=data.loc[(data.starttime<='2017-05-22 23:59:59')&(data.starttime>'2017-05-21 23:59:59')]
data_23=data.loc[(data.starttime<='2017-05-23 23:59:59')&(data.starttime>'2017-05-22 23:59:59')]
data_24=data.loc[(data.starttime<='2017-05-24 23:59:59')&(data.starttime>'2017-05-23 23:59:59')]#统计14号数据
bike_count_14=data_14['bikeid'].value_counts()
user_count_14=data_14['userid'].value_counts()#时间分区间统计
bin=pd.date_range(start='2017-05-14 00:00:00',end='2017-05-15 00:00:00',freq='0.5H')
data_scattertime=pd.cut(data_14['starttime'],bin)
scattertime_count=data_scattertime.value_counts(sort=False)
scattertime_count.plot(kind='line')
14号的分时间段的订单量结果图:
膜拜共享单车数据分析相关推荐
- sql date类型_共享单车数据分析的SQL数据库设计
SQL,发音为" sequel"(或SQL,如果愿意的话),是数据科学家的重要工具.实际上,它可以说是获取数据工作中最重要的语言.在共享单车数据分析的SQL设计中,我们将从入门者的 ...
- 摩拜共享单车数据分析项目报告
文章目录 项目背景 数据探索 数据挖掘 数据分析 时间维度 空间维度 用户维度 项目背景 随着智能手机的普及和手机用户的激增,共享单车作为城市交通系统的一个重要组成部分,以绿色环保.便捷高效.经济环保 ...
- 毕业设计 题目:基于大数据的共享单车数据分析
文章目录 0 前言 1 项目背景 2 项目分析思维导图 3 项目分析具体步骤 3.1 读取数据 3.2 数据分析 3.1.1 数据预处理--每日使用量分析 3.1.2 连续7天的单日使用分析结论 3. ...
- 共享单车数据分析的SQL数据库设计
SQL,发音为" sequel"(或SQL,如果愿意的话),是数据科学家的重要工具.实际上,它可以说是获取数据工作中最重要的语言.在共享单车数据分析的SQL设计中,我们将从入门者的 ...
- kaggle共享单车数据分析及预测(随机森林)
文章目录 一.数据收集 1.1.项目说明 1.2.数据内容及变量说明 二.数据处理 2.1.导入数据 2.2.缺失值处理 2.3.Label数据(即count)异常值处理 2.4.其他数据异常值处理 ...
- Spark SQL上海摩拜共享单车数据分析
1 生成DataFrame对象 val bikeDF = sqlContext.read.format("csv").option("header", &quo ...
- 美国共享单车数据分析
分析三大美国城市的自行车共享系统相关的数据:芝加哥.纽约和华盛顿特区.写一个脚本,该脚本会接受原始输入并在终端中创建交互式体验,以展现这些统计信息. 目录 数据集说明: 起始时间分析: 骑行时长分析: ...
- 毕业设计 基于大数据的共享单车数据分析与可视化
文章目录 0 前言 1 课题背景 2 数据清洗 3 数据可视化 热力图 整体特征分布 **查看2011-2012间的单车租借情况** 天气对于租借数量的影响 湿度与温度对于租借数量的影响 注册用户与未 ...
- python共享单车数据分析_数据分析_共享单车骑行时间分析-zeropython
数据分析一共分为五个任务: 第一步:明确分析的任务 分析出每个季度的骑行的平均时长和各个季度的对比 第二步:数据处理 先看数据: shell 查看csv 数据前十行 ➜ data cat bikesh ...
最新文章
- python自学需要多久-自学Python多久能找到工作
- 【图像分类】 图像分类中的对抗攻击是怎么回事?
- 2018-2019-1 20165237 《信息安全系统设计基础》第四周学习总结
- 下一清分日期是几年前_下一清分日期是什么意思
- 【数据结构与算法】之深入解析“水壶问题”的求解思路与算法示例
- 牛客练习赛43 Tachibana Kanade Loves Probability(快速幂)
- async await实例
- 2018.09.15 vijos1053Easy sssp(最短路)
- jmeter远程启动命令_Jmeter命令行方式启动
- 又一起删库跑路事件!宕机36小时、损失近10亿,腾讯云还差点背锅...
- JavaScript-箭头函数
- 蓝桥杯第十三届省赛题目(4月23日)答案汇总 python
- 电子科学与技术毕业论文题目【452个】
- Linux ERROR: configuration failed for package ‘rgeos’
- matlab rtw 生成c代码,MATLAB Coder ——从MATLAB代码生成C/C++代码
- 任务栏-IDEA图标变白色
- 服务器win10系统开机慢,Win10系统更新后开机变得很慢的解决方法
- 微信全面开放个人免费版红包封面!
- K3ERP web登录问题解决
- IP 基础知识“全家桶”,45 张图一套带走
热门文章
- Android第三方登陆之新浪微博Weibo篇(原生登陆授权)
- 现在做什么生意比较赚钱,且投资小利润大?
- matlab模拟gpd,GPD WIN1流畅玩游戏之DOS游戏,阿猫阿狗大作战 大宇16个DOS游戏全合集...
- 雨晨QQ2013beta2(5865) 双显IP纯净完整自选版
- HT1382时钟芯片代码
- HTML4.01、XHTML 1.0、HTML5版本变化
- 诚之和:“世界第二富豪”贝索斯:20亿美金拿去花,别再骂我不管地球了
- 玩骰子的儿童(赫拉克利特)
- 计算机声卡原理,关于声卡的性能的理解
- 如何做好社群运营,实现私域流量转化,圈量SCRM教您一招