基于大数据的高校英语现状分析
温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :)
1. 项目简介
全球化时代,英语的重要性日益凸显。现如今我国高校英语教育还存在教学形式单一、没有创新、传统模式已经不适合当今社会发展等弊端,需要制订出符合国情的教学规划,采取相对应的策略,增进教育理念,培养高素质人才。本项目利用 pandas + Matplotlib + seaborn + sklearn 等工具包对某高校各大学院学生历年的四六级数据进行多维度的统计分析,展现高校英语的现状,为英语教学改革提供精细化的分析。
2. 四六级成绩数据读取
df_202009_six = pd.read_excel('./data/2020年9月大学英语六级成绩.xls')
df_202009_four = pd.read_excel('./data/2020年9月大学英语四级成绩.xls')
df_202012_six = pd.read_excel('./data/2020年12月份六级成绩.xls')
df_202012_four = pd.read_excel('./data/2020年12月份四级成绩.xls')
df_202106_six = pd.read_excel('./data/2021年6月份英语六级成绩数据.xls')
df_202106_four = pd.read_excel('./data/2021年6月份英语四级成绩数据.xls')
3. 数据可视化探索分析
3.1 不同学院报考的学生数量分布
plt.figure(figsize=(16, 5))
plt.subplot(121)
ax = sns.countplot(df_202009_six['学院'], order=sorted(list(set(df_202009_six['学院']))))
ax.set_xticklabels(ax.get_xticklabels(),rotation=90)
plt.title('2020年9月各学院大学英语六级报考人数', fontsize=16, weight='bold')plt.subplot(122)
ax = sns.countplot(df_202009_four['学院'], order=sorted(list(set(df_202009_four['学院']))))
ax.set_xticklabels(ax.get_xticklabels(),rotation=90)
plt.title('2020年9月各学院大学英语四级报考人数', fontsize=16, weight='bold')
plt.show()
3.2 各学院六级得分变化与分布情况
3.3 各学院四级得分变化与分布情况
3.4 各学院四六级考试弃考率变化情况
3.5 各学院四六级得分分布箱型图
xueyuan_6_dict = {k: 0 for k in set(df_202106_six['学院'])}for xueyuan in xueyuan_6_dict:xueyuan_df = df_202106_six[df_202106_six['学院'] == xueyuan]if xueyuan_df.shape[0] == 0:continuedefen = xueyuan_df['总分'].valuesdefen = defen[defen > 0]xueyuan_6_dict[xueyuan] = defen.tolist()
plt.figure(figsize=(16, 10))
plt.boxplot(xueyuan_6_dict.values(), labels = xueyuan_6_dict.keys())
plt.title('各学院六级得分分布箱型图', fontdict={'weight':'normal','size': 20})
pl.xticks(rotation=90)
plt.show()
3.6 各科目得分与总分之间的回归分析
3.7 各学院四六级及格率统计分析
xueyuan_4_dict = {k: 0 for k in set(df_202106_four['学院'])}for xueyuan in xueyuan_4_dict:xueyuan_df = df_202106_four[df_202106_four['学院'] == xueyuan]if xueyuan_df.shape[0] == 0:continuepass_df = xueyuan_df[xueyuan_df['总分'] >=425]pass_ = pass_df.shape[0]pass_ratio = pass_ * 1.0 / xueyuan_df.shape[0]xueyuan_4_dict[xueyuan] = pass_ratioprint(f'{xueyuan}:{pass_ratio}')xueyuan_4_dict = sorted(xueyuan_4_dict.items(), key=lambda x: x[1], reverse=True) plt.figure(figsize=(16, 6))
plt.bar([x[0] for x in xueyuan_4_dict], [x[1] for x in xueyuan_4_dict])
pl.xticks(rotation=90, fontsize=14)
plt.title('各学院四级通过率分布柱状图', fontdict={'weight':'normal','size': 20})
plt.show()
4. 总结
全球化时代,英语的重要性日益凸显。现如今我国高校英语教育还存在教学形式单一、没有创新、传统模式已经不适合当今社会发展等弊端,需要制订出符合国情的教学规划,采取相对应的策略,增进教育理念,培养高素质人才。本项目利用 pandas + Matplotlib + seaborn + sklearn 等工具包对某高校各大学院学生历年的四六级数据进行多维度的统计分析,展现高校英语的现状,为英语教学改革提供精细化的分析。
欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。
技术交流认准下方 CSDN 官方提供的学长 Wechat / QQ 名片 :)
精彩专栏推荐订阅:
1. Python 毕设精品实战案例
2. 自然语言处理 NLP 精品实战案例
3. 计算机视觉 CV 精品实战案例
基于大数据的高校英语现状分析相关推荐
- 基于大数据的高校生源可视化分析系统
温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :) 1. 项目简介 随着高校新生的增加,学生的数据也越来也多,怎么使用 好这些数据,对数据进行分析和挖掘成为了研究的热点 ...
- 毕业设计 基于大数据的高校校园学生一卡通数据分析
文章目录 0 项目简介 任务 1数据导入与预处理 任务 1.1 探查数据质量并进行缺失值和异常值处理 1.1.2检查重复值 1.1.3数据内容总览 1.1.4数据分布总览 1.1.5消费金额和消费次数 ...
- 基于大数据的农产品价格信息监测分析系统
温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :) 1. 项目简介 本项目利用网络爬虫技术从某蔬菜网采集所有农产品的价格数据,包括北京.上海.安徽.湖北等全国所有省和直 ...
- 基于大数据审计的信息安全日志分析法
大数据信息安全日志审计分析方法 1.海量数据采集.大数据采集过程的主要特点和挑战是并发数高,因此采集数据量较大时,分析平台的接收性能也将面临较大挑战.大数据审计平台可采用大数据收集技术对各种类型的数据 ...
- 上海鸥新:基于大数据的商场实时客流分析系统
公司介绍 上海鸥新软件有限公司专注于室内定位技术和客流统计与分析的研发,如室内定位引擎.客流统计与分析系统.在用户导入客流系统的同时,为商业零售实体店提供了网络覆盖.微信上网,定时定地点向客户进行精准 ...
- 基于大数据电商平台日志分析
一.项目介绍 1.1 项目介绍 本次实训,要求使用Hadoop及其生态圈相关的组件来实现企业级大数据开发的整套流程,即数据的采集.数据的存储.数据的分析处理及数据的可视化.其中数据的采集部分会介绍两种 ...
- [附源码]Python计算机毕业设计SSM基于大数据的高校国有固定资产管理及绩效自动评价系统(程序+LW)
项目运行 环境配置: Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX(Webstorm也行)+ Eclispe(IntelliJ IDEA,Eclispe,MyEclis ...
- 爬虫+数据分析+可视化大作业:基于大数据的高质量电影分析报告
主要目的是为了学习Scrapy与Sklearn而不是写论文,结论是瞎扯的,轻喷求求了 目录 摘要 数据爬虫程序设计和实现 Scrapy框架 Scrapy框架简介 Scrapy的组件 Scrapy的工作 ...
- 计算机毕设(附源码)JAVA-SSM基于大数据的高校国有固定资产管理及绩效自动评价系统
项目运行 环境配置: Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX(Webstorm也行)+ Eclispe(IntelliJ IDEA,Eclispe,MyEclis ...
最新文章
- shiro缓存管理时报错java.lang.ClassCastException: com.xxx.User cannot be cast to com.xxx.User
- oracle thin和oci 区别
- sql server表分区_SQL Server中的FORCESCAN和分区表
- think php5目录结构,目录结构 · ThinkPHP5.1完全开发手册 · 看云
- win10 Java 环境配置
- 组态王bitset用法_组态王使用问题解答8
- c语言中正方形的周长,长方形 正方形面积 和周长的公式
- python与建筑结构设计_29个常见的结构设计问题盘点
- quot 成为通用计算机器 quot,汉语拼音:从读写工具到文化津梁
- word按backspace键不能删除问题
- Liunx 用户及组,文件相关命令
- EOS代码架构及分析(四)
- 知乎上看到一篇有关三门问题比较好的讲解
- 如何把密码写入代码,让VBA自动撤销工作表保护 / 工作簿保护(使用VBA代码 保护工作表 / 工作簿 和取消保护工作表 / 工作簿)
- 简单跑酷java代码_如何实现一个简单的跑酷游戏?(代码详解)
- 计算机病毒金山毒霸,金山毒霸发布7月27日计算机病毒预警
- 玩转云网络,这里有一份VMware最强指南
- 什么是docker –rm选项
- Pycharm自定义更换背景图,来给代码加个PS~~~
- ArcGIS插件 - 易至天工影像加载插件