温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :)

1. 项目简介

本项目利用网络爬虫技术从某高考网抓取各大高校的历年高空录取分数线,并进行数据清洗存储到文件系统中,对外提供高校信息查询服务和依据高空分数筛选可能录取的高校等信息,方便考生选择合适的学校进行填报。 以高校搜索,查看该高校不同专业历年的录取分数线,以专业搜索,可查看不同高校该专业的录取分数线情况,以分数搜索,可查看可录取的高校和专业。 本项目利用 pandas + sklearn 对高考的高校和专业的数据进行统计分析,并利用 flask 搭建后台,构建标准 restful 接口,前端利用 bootstrap + echarts + jquery 调用后台接口,并进行前端的渲染可视化。

【系统演示】基于 Python 的高考志愿高校及专业分析系统

2. 功能组成

基于 Python 的高考志愿高校及专业分析系统的功能主要包括:

3. 高校及专业录取分数线信息抓取

利用 python 的 request + beautifulsoup 等工具包编写高考分数线信息的原生爬虫,抓取的信息经过数据清洗和结构化后存储到数据库或文件系统中:

for page in range(1, total_page):url = base_url.format(page)print('抓取第 {} 页的数据, {}'.format(page, url))headers = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9','Content-Type': 'application/x-www-form-urlencoded','Accept-Encoding': 'gzip, deflate, compress','Accept-Language': 'en-us;q=0.5,en;q=0.3','Cookie': 'Your cookies','User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36','Referer': url,'Host': 'xxxxxx.xxx.com'}response = requests.get(url, headers=headers)response.encoding = 'gbk'soup = BeautifulSoup(response.text, 'lxml')scores_List = soup.find(name='div', attrs={'class': 'scores_List'})dls = scores_List.find_all(name='dl')for dl in dls:try:score_info = {}name = dl.find('strong').textlink = dl.find('a')['href']print(name, link)# 打开学校的详情页response = requests.get(link, headers=headers)response.encoding = 'gbk'soup = BeautifulSoup(response.text, 'lxml')# 大学的基本信息college_msg = soup.find('div', class_=['college_msg', 'bk'])# 趋势线score_qushi = soup.find('div', class_='graybox').imgif score_qushi:score_qushi = score_qushi['src']score_table = soup.find('div', class_='tabCon5').table# 平均分mean_score = score_table.find('td', id='pjf').textscore_info = {'高校': name,'链接': link,'基本信息': str(college_msg),'录取分数线图': score_qushi,'平均分': int(mean_score),'历年分数线': str(score_table)}all_school_infos.append(score_info)except Exception as e:pass

4. 基于 Python 的高考志愿高校及专业分析系统

4.1 系统注册登录

4.2 查询高校基本信息和历年录取分数线

搜索清华大学:

搜索中央财经大学:

4.3 知分填志愿:查询可能录取的高校

4.4  专业搜索:查询各大高校专业分数线

用户输入感兴趣的专业,查看各大高校该专业的录取分数线情况,点击该学校可继续查看该学校的基本信息和历年的录取情况:

5. 总结

本项目利用网络爬虫技术从某高考网抓取各大高校的历年高空录取分数线,并进行数据清洗存储到文件系统中,对外提供高校信息查询服务和依据高空分数筛选可能录取的高校等信息,方便考生选择合适的学校进行填报。 以高校搜索,查看该高校不同专业历年的录取分数线,以专业搜索,可查看不同高校该专业的录取分数线情况,以分数搜索,可查看可录取的高校和专业。 本项目利用 pandas + sklearn 对高考的高校和专业的数据进行统计分析,并利用 flask 搭建后台,构建标准 restful 接口,前端利用 bootstrap + echarts + jquery 调用后台接口,并进行前端的渲染可视化。

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码

技术交流认准下方 CSDN 官方提供的学长 Wechat / QQ 名片 :)

精彩专栏推荐订阅:

1. Python 毕设精品实战案例
2. 自然语言处理 NLP 精品实战案例
3. 计算机视觉 CV 精品实战案例

基于 Python 的高考志愿高校及专业分析系统相关推荐

  1. 【计算机专业毕设之基于python爬虫的汽车销量预测可视化分析系统-哔哩哔哩】 https://b23.tv/2gOjMVB

    [计算机专业毕设之基于python爬虫的汽车销量预测可视化分析系统-哔哩哔哩] https://b23.tv/2gOjMVB https://b23.tv/2gOjMVB

  2. 基于 Python 的大型超市商品销售关联度分析系统

    温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :) 1. 项目背景 本项目通过对数据挖掘领域中的关联规则经典算法Apriori,运用关联规则对某大型超市超市的部分数据进 ...

  3. 基于Python语言的PUBG游戏数据可视化分析系统

    [success]写于2019年大作业[/success] 博客链接:https://www.iamzlt.com/?p=299 代码链接请到博客链接内查看. 摘要 随着网络技术的兴起和普及,网络游戏 ...

  4. 基于python的小说大数据预测可视化分析系统

    https://b23.tv/8x689Tm .使用requests模块爬取17k小说网站的数据,网站存在严重的加密反爬,使用bs4模块解析数据,然后存入数据. 2.使用使用sklearn 实现一元线 ...

  5. 基于python爬虫天气象大数据可视化分析系统

    https://b23.tv/sxy54Qn flask web框架,数据使用requests模块爬取数据,使用bs4模块解析数据,并且存入数据库.数据库使用sqlite数据库.使用flask_sql ...

  6. 基于Python的旅游景点的数据采集与分析的研究

    在旅游景点不断扩张,本基于Python的旅游景点的数据采集与分析系统按照软件开发方法进行研究,对系统先进行需求分析,确定系统必须做什么,进而进行系统设计,设计出满足需求的新系统,最后才是系统功能实现以 ...

  7. 【高考志愿】计算机专业志愿填报指南

    [高考志愿]计算机专业志愿填报指南 清华的计算机学院设有计算机科学与技术.软件工程.网络空间安全三个一级学科,这里再添加两个近几年很多学校都新设的人工智能.大数据专业 这五个专业,应该能囊括大多数学校 ...

  8. ⑰霍兰德EI*如何选选专业?高考志愿填报选专业

    霍兰德职业兴趣测试,由美国职业指导专家霍兰德编制,是首位提出职业和兴趣理论的人,关于兴趣和职业我的看法是兴趣驱动人的学习主动性,而兴趣的实质是人的性格特征(也叫气质),这种特征决定我们在某些方面更加擅 ...

  9. 文秘要学计算机吗,高考志愿:计算机专业和文秘专业哪个适合女生?

    原标题:高考志愿:计算机专业和文秘专业哪个适合女生? 肯定是文秘专业更加适合女生吧,这对绝大部分女生来说是适用的.其实目前对高中毕业之后读大专的话,能够选择的热门专业不多. 目前这个文秘类的专业,像这 ...

最新文章

  1. python读取nii文件_python实现批量nii文件转换为png图像
  2. 恕我直言,90% 的应用场景都不需要用WebAssembly!
  3. 运营,如何用数据说话?(以电商活动复盘为例)
  4. 委托、Lambda表达式和事件
  5. 过程声明与同名事件或过程的描述不匹配_多特征结合的倾斜无人机影像匹配方法...
  6. Even for transaction data request, metadata is still needed as prerequisite
  7. leetcode 1738. 找出第 K 大的异或坐标值
  8. 安装Vuecli新版本正常,但是显示版本是低版本
  9. 美妆海报不会做? PSD分层模板带你轻松掌握!
  10. 服务器搭建对讲机系统,传统对讲机系统如何接入到融合通信系统?
  11. 别再说Python简单!
  12. 用Gradle 构建你的android程序
  13. linux 安装p7zip 支持rar
  14. matplotlib多张子图画在一起
  15. Persistent Bugger 实践练习
  16. 未能联接game center服务器,苹果game center无法连接服务器怎么办呢?
  17. 算法分析中的小o符号
  18. matlab实现密堆立方体,LAMMPS如何定义六角密堆结构HCP
  19. 大数据分析案例-基于决策树算法构建银行客户流失预测模型
  20. Mysql有四种事务隔离级别,详解脏读、不可重复读、幻读

热门文章

  1. 前端实现“查看更多”效果
  2. 【SpringBoot】11、SpringBoot中使用Lombok
  3. 一、软件测试学习方向
  4. 【报错】python编码问题:UnicodeDecodeError:‘utf-8‘codec can‘t decode byte 0xce in position 52: invalid contin
  5. caffe 损失函数
  6. 目标定位算法(三)之基于角度的定位算法
  7. 范围变更管控案例_项目范围管理案例之范围确认案例
  8. 金属基功能单体/高折射率功能单体/特种丙烯酸酯单体/特种甲基丙烯酸酯单体
  9. 疫情下的远程办公,充满了崩溃与机遇
  10. Arcgis绘图初级教程