温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :)

1. 项目简介

本项目基于国内某高校校园一卡通系统一个月的运行数据,使用数据分析和建模的方法,挖掘数据中所蕴含的信息,对学生在校园内的消费行为、生活习惯和消费金额等方面进行规律分析,同时对学校不同食堂、商铺等销售数据、人流量等维度进行统计分析,并构建 web 交互平台,通过视觉感知,更清晰直观、方便快速地抓住数据的信息,辅助管理者做出高效的决策。

2. 功能组成

基于大数据的校园一卡通数据分析与可视化平台的功能主要包括:

(1)数据挖掘及分析

包括个人消费总额的聚类,消费特征聚类分析,人流量分析,热点商户分析。

(2)学生消费特征

对不同人群进行群体标签划分,分为 节约型 低消费型  适当型 高消费型,对不同人群在总样本中的占比进行行为分析。

(3)热点商户分析

对不同的商户进行个人消费频率 平均单笔交易金额和总金额的统计,进行热度排序及展示。

(4)可视化平台

包括不同消费特征人群的占比及人均消费金额显示 热点商户的排名显示 不同时段各人流量显示。

3. 基于大数据的校园一卡通数据分析与可视化平台

3.1 系统首页和注册登录

3.2 学生消费行为分析

3.2.1 学生消费次数和总金额(元)的分布情况

可以看出,学生本月的消费次数和消费的总金额均呈现长尾分布,且只有少部分的学生消费次数和金额较大。

3.2.2 学生消费特征群体标签划分分布情况

通过对学生消费总金额对不同学生人群进行群体标签划分,分为:节约型、低消费型、适当型、高消费型,对不同人群在总样本中的占比进行行为分析:

def student_analysis():"""学生维度的分析"""people_df = df['PeoNo'].value_counts().reset_index()# 消费总金额people_money = df[['PeoNo', 'Money']].groupby('PeoNo').sum().reset_index()people_money = people_money.sort_values(by='Money', ascending=False)# 对不同人群进行群体标签划分,分为 节约型 低消费型  适当型 高消费型,对不同人群在总样本中的占比进行行为分析def calc_type(money):if money > 1000:return '高消费型'elif money > 500:return '适当型'elif money > 300:return '低消费型'else:return '节约型'people_money['type'] = people_money['Money'].map(calc_type)type_count_dict = people_money['type'].value_counts().to_dict()# 不同时间点消费次数和金额的分布情况weekday_money = df[['Weekday', 'Money']].groupby('Weekday').sum().reset_index()weekday_money = weekday_money.sort_values(by='Weekday', ascending=True)hour_money = df[['Hour', 'Money']].groupby('Hour').sum().reset_index()hour_money = hour_money.sort_values(by='Hour', ascending=True)

可以看出,只有极少部分的学生为高消费型人群,绝大部分为节约型以及低消费型,大部分的大学生都是理性消费,甚至偏向节约。

3.2.3 学生在不同时间点消费总金额(元)差异分布情况

对学生消费总金额按照星期和小时维度进行统计分析,可以看出:

(1)周五之后消费总金额逐渐下降,周六日的消费额最小,可能是大部分学生周六日放假期间选择外出就餐等消费行为,符合预期;

(2)每天当中 11-12点和17-18点的消费达到高峰,分别对应学生的中午和晚上就餐时间,同时还可以发现,早上的消费金额明显比中午和晚上少,可能是由于早餐比较便宜,以及部分学生选择早上不吃饭。

3.3 店铺维度统计分析

3.3.1 不同店铺/食堂学生消费总次数分布情况

以店铺/食堂等维度进行统计分析,分析学生的消费都分布在哪些店铺:

def shop_analysis():"""店铺维度分析"""dept_count_dict = df['Dept'].value_counts().to_dict()# 消费总金额people_money = df[['Dept', 'Money']].groupby('Dept').sum().reset_index()people_money = people_money.sort_values(by='Money', ascending=False)# 店铺人均消费shop_mean = df[['Dept', 'Money']].groupby('Dept').mean().reset_index()top_shop = [k for k in dept_count_dict if dept_count_dict[k] > 700]shop_mean['hot_dept'] = shop_mean['Dept'].map(lambda x: x in top_shop)shop_mean = shop_mean[shop_mean['hot_dept']]shop_mean = shop_mean.sort_values(by='Money', ascending=False)

可以看出:

(1)第二食堂和第五食堂非常受学生们的欢迎,消费总次数远远多余其他食堂。同时还可以发现,消费的除了食堂,还包括水电缴费、食品店、学校财务处、超市、医务室等地方;

(2)第四食堂学生的消费总金额最多,其次是第四食堂,财务处最少。

3.3.2 热门店铺人均消费占比和排名分布情况

通过对商铺的消费金额和次数的人均统计分析,可以看出,教师食堂的价格最贵,的确如此,教师食堂主要是面向教职工开发,一般价格也相对偏贵。最受欢迎的第二食堂是因为在所有食堂中人均消费最低,大部分学生更偏向于选择第二食堂,与前面分析的大部分学生为节约型以及低消费型消费行为的结论相对应!

3.3.3 热门商铺人流量随时间分布变化情况

通过对热门商铺人流量的时序分析,可以看出,人流量呈现出周期性特性,消费人流量高峰集中在中午11点-12点,此时间段为中午消费高峰,符合预期。

4. 总结

本项目基于国内某高校校园一卡通系统一个月的运行数据,使用数据分析和建模的方法,挖掘数据中所蕴含的信息,对学生在校园内的消费行为、生活习惯和消费金额等方面进行规律分析,同时对学校不同食堂、商铺等销售数据、人流量等维度进行统计分析,并构建 web 交互平台,通过视觉感知,更清晰直观、方便快速地抓住数据的信息,辅助管理者做出高效的决策。

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码

技术交流认准下方 CSDN 官方提供的学长 Wechat / QQ 名片 :)

 精彩专栏推荐订阅:

1. Python 毕设精品实战案例
2. 自然语言处理 NLP 精品实战案例
3. 计算机视觉 CV 精品实战案例

基于大数据的校园一卡通数据分析与可视化平台相关推荐

  1. 【Spark+Hadoop+Hive+MySQL+Presto+SpringBoot+Echarts】基于大数据技术的用户日志数据分析及可视化平台搭建项目

    目录 1.项目概述 1.1.项目背景 1.2.项目流程 2.功能需求描述 2.1.系统功能组成 2.2.数据描述 2.3.功能描述 2.3.1.流量概况分析 2.3.2.日新日活分析 2.3.3.交互 ...

  2. 大数据毕设 - 校园卡数据分析与可视化(python 大数据)

    文章目录 0 前言 1 课题介绍 2 数据预处理 2.1 数据清洗 2.2 数据规约 3 模型建立和分析 3.1 不同专业.性别的学生与消费能力的关系 3.2 消费时间的特征分析 4 Web系统效果展 ...

  3. 毕业设计 基于大数据的共享单车数据分析与可视化

    文章目录 0 前言 1 课题背景 2 数据清洗 3 数据可视化 热力图 整体特征分布 **查看2011-2012间的单车租借情况** 天气对于租借数量的影响 湿度与温度对于租借数量的影响 注册用户与未 ...

  4. 毕业设计 题目:基于大数据的共享单车数据分析

    文章目录 0 前言 1 项目背景 2 项目分析思维导图 3 项目分析具体步骤 3.1 读取数据 3.2 数据分析 3.1.1 数据预处理--每日使用量分析 3.1.2 连续7天的单日使用分析结论 3. ...

  5. 金融科技大数据产品推荐:蓝金灵—基于大数据的电商企业供应链金融服务平台

    官网 | www.datayuan.cn 微信公众号ID | datayuancn 本产品为数据猿推出的"金融科技价值-数据驱动金融商业裂变"大型主题策划活动第一部分的文章/案例/ ...

  6. 基于大数据技术的综合数据分析平台

    对于企业来说,利用大数据技术建立综合数据分析平台有利于企业内的管理人员更好地掌握企业的实际情况,有效控制企业的经营成本,提高企业的经济效益,同时全面提高企业的管理水平,对企业的发展有非常积极的促进作用 ...

  7. [计算机毕业设计]大数据的B站数据分析与可视化

    目录 前言 课题背景和意义 实现技术思路 数据爬取 数据可视化 实现效果图样例 前言

  8. 大数据毕设 Python消费数据分析与可视化

    文章目录 0 前言 **1 背景介绍** **2 数据处理** 数据说明 数据获取及查看 3 数据可视化分析 4 结论 5 最后 0 前言

  9. 毕业设计-基于大数据的电影爬取与可视化分析系统-python

    目录 前言 课题背景和意义 实现技术思路 实现效果图样例 前言

最新文章

  1. 【传统PSTN与互联网通信】
  2. 数字签名的java实现(RSA,DSA)
  3. 天津大学考研计算机专业课的教材,天津大学(专业学位)计算机技术研究生考试科目和考研参考书目...
  4. 牙齿间隙变大怎么办_牙齿缝隙大怎么办 5个方法解决牙齿缝隙大
  5. Python虚拟环境的搭建
  6. ueditor php提交表单,ThinkPHP使用Ueditor的方法详解
  7. 系统各层关注的内容【DDDD笔记】
  8. 1. 软件开发流程与QA工作流程
  9. WPS永久关闭热点、云服务、初始登陆界面
  10. c++早绑定和晚绑定
  11. uC/OS信号量Pend和Post都会做些什么
  12. Jquery颜色选择插件使用
  13. SpringBoot整合Shiro搭建登录注册认证授权权限项目模板
  14. 独家整理: 六款高质量的办公资源网站,疯狂提高你的工作效率
  15. TextRNN+attention
  16. 敏涵控股集团董事长刘敏不忘初心 做新时代的铿锵玫瑰
  17. 傲娇大少之——【GET请求和POST请求】
  18. 数控加工的常用计算公式
  19. *♎* 埃斯顿机器人回零教程 *♎*
  20. org.xml.sax.SAXParseException: The markup in the document following the root element must be well-fo

热门文章

  1. 剑灵服务器名修改,“名”动服务器!你想要的剑灵名字都在这
  2. C语言常用函数(内容扎实)
  3. 三维点云配准是什么意思
  4. Android 架构之路(4)责任链模式在项目中的实际使用
  5. linux安装oracle12C客户端(适用于18C客户端和19C客户端)
  6. java版本结巴分词算法bug
  7. Greenplum 实时数据仓库实践(2)——数据仓库设计基础
  8. 2021 年买这几只基金和股票,你肯定能赚钱
  9. 5天赚十亿!纯C/C++语言打造“西虹市首富”
  10. Gradle 完整指南(Android)