大家好,我是阿辰。

今天带大家来看一下全国所有大学的数据信息(包括专本科,覆盖全国),一共是获取到了全国31个省份,共2769所大学。先预览一下数据:

这里字段主要是包括了(省份、大学、类型、公或民办、本会专科、985、211、双一流、城市、隶属于、地址)

本文除了讲解怎么获取数据外,还将对这些数据进行可视化展示分析。

PS: 下面将一大把可视化动图袭来,别被震撼到,因为实在是太炫酷了(哈哈哈)

1.获取数据

网页分析

在开始获取之前,先说一下数据的来源:

https://gkcx.eol.cn/school/search?schoolflag=&fromcoop=bdkp&is_recruitment=1&province=&cityname=

上图就是对应的网页,通过分析发现,数据是通过异步请求方式进行加载,因此打开Network,查看数据包,找到了数据在下面的数据包中

打开返回的json数据

可以看到数据已经获取到了,并且是在data下的item里面。

下一页分析

请求的异步链接:

https://api.eol.cn/gkcx/api/?access_token=&admissions=&central=&department=&dual_class=&f211=&f985=&is_doublehigh=&is_dual_class=&is_recruitment=1&keyword=&nature=&page=1&province_id=64&ranktype=&request_type=1&school_type=&signsafe=&size=20&sort=view_total&type=&uri=apidata/api/gk/school/lists

通过异步链接可以发现,参数page是页面,province_id是对应的省份id(id是从11开始,12、13…)

因此通过变化page和province_id即可获取不同省份以及该省份所有大学情况,其核心代码如下:

for province_id in range(11,70):try:page = 1while(1):url = "https://api.eol.cn/gkcx/api/?access_token=&admissions=&central=&department=&dual_class=&f211=&f985=&is_doublehigh=&is_dual_class=&is_recruitment=1&keyword=&nature=&page="+str(page)+"&province_id="+str(province_id)+"&ranktype=&request_type=1&school_type=&signsafe=&size=20&sort=view_total&type=&uri=apidata/api/gk/school/lists"text = requests.get(url,headers=headers).json()datas = text['data']['item']page = page+1if len(datas)>0:for i in range(0,len(datas)):print(datas[i]['province_name'])print(datas[i]['name'])print(datas[i]['type_name'])print(datas[i]['nature_name'])print(datas[i]['level_name'])print(datas[i]['f985'])print(datas[i]['f211'])print(datas[i]['dual_class_name'])print(datas[i]['city_name'])print(datas[i]['belong'])print(datas[i]['address'])else:breakexcept:pass

最后将数据保存到excel中

一共是2769所大学,下面开始进行可视化分析。

2.可视化分析

1.不同省份大学数量

从excel中取出省份这一列,统计每一个省份行数,并进行排序

datafile = u'全国大学数据-李运辰.xls'
data = pd.read_excel(datafile)
attr = data['省份'].tolist()
result = Counter(attr)
# 排序
d = sorted(result.items(), key=lambda x: x[1], reverse=True)

分析

从排序上来看,江苏省的大学数量是最多的(168所),其次分别是山东、广东、河南、四川等

可视化效果

2.统计省份对应不同市大学数量

这里以广东省和吉林省为例,统计该省不同市有多少所大学

###广东所有城市
gd_city = []
###吉林所有城市
jl_city = []
for index, row in data.iterrows():if row[0]=="广东":gd_city.append(row[8])if row[0]=="吉林":jl_city.append(row[8])
print(gd_city)
print(jl_city)

下面开始统计城市数量并进行排序

分析

从图中可以看到,广东省的大学主要聚集在广州市较多(83),占比约50%。吉林省的大学主要聚集在长春市较多(43),占比约65%。

可视化效果

3. 985、211以及双一流数量

分别统计985、211以及双一流数量,先看一下数据(其中985和211这两列,1表示是,2表示不是)

 for index, row in data.iterrows():if row[5] == 1:data_985.append(row[1])if row[6] == 1:data_211.append(row[1])if row[7] == "双一流":data_two_one.append(row[1])

我们都知道985院校是39所,这里显示46所,这个是没错的,因为一些985院校有分校,所以就累计了46所,比如北京大学和北京大学医学部,这都是985

4.公或民办类型数量

分析

从动图上来看,公办大学数量最多(2010),这个结果毫无疑问!其次还有少部分是中外合作办学

5.本或专科数量

分析

从整体趋势上来看,本科和专科大学数量相差大概是在100左右!!

6.全国不同类型大学数量情况

先看一下数据

下面开始统计不同类型个数,并进行可视化展示分析


attr = data['类型'].tolist()
result = Counter(attr)
# 排序
d = sorted(result.items(), key=lambda x: x[1], reverse=True)
print(d)
key = [i[0] for i in d]
value = [i[1] for i in d]

可视化效果:

分析

从图上来看,理工类和综合类大学居多,师范类和财经类以及医药类其次。

7.全国不同大学隶属情况

同样的先看一下数据

下面开始统计不同类型个数,并进行可视化展示分析

attr = data['隶属于'].tolist()
result = Counter(attr)
# 排序
d = sorted(result.items(), key=lambda x: x[1], reverse=True)
print(d)
key = [i[0] for i in d]
value = [i[1] for i in d]

可视化效果:

分析:

从图上可以看到前几名(河南、江苏、山东、广东)是属于省份的,猜测可能是普通本科以及专科院校居多,因此学校类型属于省份。

3.小结

本文讲解了如何去获取全国大学数据,最后通过可视化的方式展示数据,并进行分析。

如果想要学习python的小伙伴,可以下方扫码加我微信,备注:加群,我拉入进群交流学习(广告者勿扰,立刻踢),里面有大神免费答疑还有各种志同道合的小伙伴也在里面,现在就差你了!!!

太炫酷了|对全国大学数据进行可视化分析,看完后发现.....相关推荐

  1. Python酷炫毕业论文案例,对全国大学数据进行可视化分析

    前言 1.导入模块 2.不同省份大学数量 3.统计省份对应不同市大学数量 4.985.211以及双一流 5.公或民办类型数量 6.本或专科数量 7.全国不同大学隶属情况 全国所有大学的数据信息(包括专 ...

  2. 全国航班数据与可视化分析

    概述 本文通过爬取全国航班的数据,并对行数据进行可视化展示与分析. 数据来源 数据是从哪儿也不想去的去哪网抓过来.为了能够获取到数据,抓取了下请求的地址,抓取的地址如下: https://flight ...

  3. python大游戏_玩游戏就能学Python?太炫酷了!

    原标题:玩游戏就能学Python?太炫酷了! 要说现在最火的语言,那一定是Python了. 各种排行榜里,Python的排名都是蹭蹭蹭地往上涨.Python也确实是最适合新手入门的语言了,语法简单,应 ...

  4. 鸿蒙手机壁纸有条纹,华为鸿蒙系统界面曝光,图标也实在太炫酷了,彻底摆脱安卓味道!...

    原标题:华为鸿蒙系统界面曝光,图标也实在太炫酷了,彻底摆脱安卓味道! 有很多的消费者在购买手机的时候,一般情况下都会去选择上上一款所使用的手机的品牌,因为在使用一款手机一段时间之后,对于手机的系统界面 ...

  5. 华为鸿蒙系统的手机爆光图片,华为鸿蒙系统界面曝光,图标也实在太炫酷了,彻底摆脱安卓味道!...

    原标题:华为鸿蒙系统界面曝光,图标也实在太炫酷了,彻底摆脱安卓味道! 比亚迪全新一代唐完全视频13:25秒 有很多的消费者在购买手机的时候,一般情况下都会去选择上上一款所使用的手机的品牌,因为在使用一 ...

  6. python画动态小黄鸭_抖音小黄鸭动态朋友圈封面,这效果太炫酷了

    原标题:抖音小黄鸭动态朋友圈封面,这效果太炫酷了 大家好,我是辰由,这两天满屏的小黄鸭表情包,一早就有小伙伴问我朋友封面怎样设置成动态的小黄鸭,动态的!动态的!动态的!效果不能再酷炫,先放给大家看下视 ...

  7. vipjr3月份的发布会太炫酷了吧,竟然为课堂引进了网红机器人sophia

    不知道各位朋友有没有留意到vipjr的新动作~正确来说是,vipjr隶属的集团iTutorGroup的3月份发布会里公布与国际公民机器人sophia的合作战略. vipjr3月份的发布会太炫酷了,竟然 ...

  8. 2021年全国大学生数据统计与分析竞赛赛题B—基于机器学习的用户消费行为预测(上)

    2021年全国大学生数据统计与分析竞赛赛题B-基于机器学习的用户消费行为预测(上) 一.赛题B:用户消费行为价值分析 二.基于机器学习的用户消费行为预测 1.数据简介及清洗 (一)数据简介 (二)数据 ...

  9. 2021年全国大学生数据统计与分析竞赛-B题分析

    2021年全国大学生数据统计与分析竞赛的B题代码精简版 模块加载 import numpy as np import matplotlib.pyplot as plt import pandas as ...

最新文章

  1. Java项目:家庭理财系统(java+SSM+JSP+Tomcat8+Mysql)
  2. requests.exceptions.ConnectionError: (‘Connection aborted.‘, BadStatusLine(“‘‘“,))
  3. 模块化以及插件化开发个人设计思路
  4. ITK:重新采样矢量图像
  5. 恒生证券期货行业用户维稳工作指引(一)
  6. c语言文学研究助手题目,各位达人,给小弟一个文学研究助手的c程序啊!急啊!谢谢大家啦!...
  7. MySQL数据库规范及解读
  8. c# 操作redisclient 设置过期时间_C# Redis分布式锁 单节点
  9. 开机广播没反映_我州首部反映脱贫攻坚成效的电影《冲锋号》在鹤峰开机
  10. springboot记录用户访问次数_Spring Boot入门(12)实现页面访问量统计功能
  11. iphone查看python文件_通过python获取苹果手机备份文件中的照片,视频等信息采集...
  12. Java——求解一元n次方程(V1.0)
  13. Java顺序表 实现扑克牌游戏简单 (梭哈 / 斗牛)
  14. 手势操作TouchAction
  15. 时间都去哪了——timing budget(一)
  16. 碳足迹-ISO14064认证
  17. 【深度学习图像识别课程】毕业项目:狗狗种类识别(3)代码实现
  18. 史上最全的python的web开发和网络编程【附属详细解释+案例】
  19. Gox语言中使用内存虚拟文件系统提升IO处理速度-GX43.1
  20. 2019年,这些豆瓣评分9.0以上的8本程序员好书你都知道吗?

热门文章

  1. Python基础教程100天:Day03-分支结构
  2. Picgo配置Bilibili图床
  3. 改变程序黑窗口的背景和字体颜色
  4. 无线网密码怎么改服务器停用,手机怎么修改无线网密码?
  5. Mac iterm/iterm2快捷键
  6. Dream to Control Learning Behaviors by Latent Imagination-笔记
  7. ftp与lftp命令使用
  8. 数字摄影测量特征点提取之SUSAN算子
  9. 滴滴 webapp 5.0 Vue 2.0 重构经验分享
  10. PE安装原版XP系统(含高版本PE安装选项灰色处理办法)