中国最好大学网爬取大学排名信息
最好大学网网址:http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html
从以上链接中爬取大学排名并格式化输出:
from bs4 import BeautifulSoup
import requests
import bs4def getHTMLText(url):try:r=requests.get(url,timeout=30)r.raise_for_status()r.encoding=r.apparent_encodingreturn r.textexcept:return ""def fillUniversityList(UList,text):soup=BeautifulSoup(text,'html.parser')for tr in soup.find("tbody").children:#tr必须是一个标签的内容,每一行tr表示一个大学信息,用td标签对隔开大学信息if isinstance(tr,bs4.element.Tag):tdlist=tr.find_all("td")UList.append([tdlist[0].string,tdlist[1].string,tdlist[3].string])def printUniversityList(UList):#使3列数据居中显示,域宽为10demo="{0:^10}{1:{3}^10}{2:^10}"#chr(12288)采用中文的空格填充print(demo.format("排名:","大学:","分数:",chr(12288)))for info in UList:print(demo.format(info[0],info[1],info[2],chr(12288)))def main():UInfo=[]html=getHTMLText("http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html")fillUniversityList(UInfo,html)printUniversityList(UInfo)main()
输出:
排名: 大学: 分数:
1 清华大学 95.9
2 北京大学 82.6
3 浙江大学 80
4 上海交通大学 78.7
5 复旦大学 70.9
6 南京大学 66.1
7 中国科学技术大学 65.5
8 哈尔滨工业大学 63.5
9 华中科技大学 62.9
10 中山大学 62.1
11 东南大学 61.4
12 天津大学 60.8
13 同济大学 59.8
14 北京航空航天大学 59.6
15 四川大学 59.4
16 武汉大学 59.1
17 西安交通大学 58.9
18 南开大学 58.3
19 大连理工大学 56.9
20 山东大学 56.3
21 华南理工大学 56.2
22 吉林大学 55.7
23 厦门大学 55.4
24 北京师范大学 54.6
25 北京理工大学 53.9
26 苏州大学 53.1
27 中南大学 52.5
28 北京科技大学 52.2
29 南京航空航天大学 52
30 华东理工大学 51.9
31 湖南大学 51.4
31 中国人民大学 51.4
33 重庆大学 50.9
34 华东师范大学 50.6
35 中国地质大学(武汉) 50.4
36 西北工业大学 50.3
36 电子科技大学 50.3
38 中国农业大学 48.9
38 中国石油大学(北京) 48.9
40 北京化工大学 48.6
40 北京交通大学 48.6
42 南京理工大学 48.5
43 华北电力大学(北京) 48.2
44 北京邮电大学 48.1
45 西安电子科技大学 47.6
46 武汉理工大学 47.4
46 上海大学 47.4
48 华中师范大学 47.3
48 东北大学 47.3
50 东北师范大学 47.1
51 东华大学 47
52 福州大学 46.7
53 首都医科大学 46.5
53 兰州大学 46.5
55 江南大学 46.3
56 合肥工业大学 45.6
57 南京医科大学 45.5
58 中国海洋大学 45.3
59 中国矿业大学 45.2
60 暨南大学 44.6
61 西南大学 44.4
62 南京农业大学 44.3
62 河海大学 44.3
64 哈尔滨工程大学 44.2
65 华中农业大学 44
66 中国药科大学 43.7
67 西南交通大学 43.6
68 天津医科大学 43.3
69 西北农林科技大学 42.8
69 南京师范大学 42.8
71 西北大学 42.5
72 江苏大学 42.3
73 浙江工业大学 42.1
74 北京林业大学 42
75 南京邮电大学 41.9
75 南方医科大学 41.9
75 陕西师范大学 41.9
75 南京工业大学 41.9
79 北京工业大学 41.8
80 燕山大学 41.5
81 华南师范大学 41.4
82 河北工业大学 41.1
83 北京中医药大学 41
83 浙江师范大学 41
83 汕头大学 41
86 长安大学 40.9
87 沈阳药科大学 40.8
87 湘潭大学 40.8
89 大连海事大学 40.6
90 浙江理工大学 40.5
91 杭州师范大学 40.4
91 大连医科大学 40.4
93 河北大学 40.3
94 杭州电子科技大学 40.2
94 中央民族大学 40.2
96 安徽大学 40
97 山西大学 39.4
97 宁波大学 39.4
97 石家庄铁道大学 39.4
100 扬州大学 39.3
101 湖北大学 39.2
102 温州医科大学 39
102 河北医科大学 39
104 南京信息工程大学 38.8
104 深圳大学 38.8
104 首都师范大学 38.8
107 上海理工大学 38.7
108 太原理工大学 38.6
108 浙江工商大学 38.6
110 华侨大学 38.5
110 湖南师范大学 38.5
112 广西大学 38.3
112 上海师范大学 38.3
114 上海中医药大学 38
114 东北林业大学 38
114 武汉科技大学 38
114 东北农业大学 38
118 华南农业大学 37.9
118 辽宁大学 37.9
120 青岛大学 37.8
120 长沙理工大学 37.8
120 福建医科大学 37.8
123 河北科技大学 37.7
124 河北农业大学 37.6
124 西安建筑科技大学 37.6
124 重庆医科大学 37.6
127 广州医科大学 37.5
127 河北师范大学 37.5
129 广东工业大学 37.4
129 上海海事大学 37.4
131 南昌大学 37.3
132 渤海大学 37.2
133 青岛科技大学 37
134 西安理工大学 36.8
135 东北石油大学 36.7
135 安徽医科大学 36.7
135 黑龙江中医药大学 36.7
138 沈阳航空航天大学 36.6
139 山东财经大学 36.5
140 江苏师范大学 36.4
140 三峡大学 36.4
142 黑龙江大学 36.3
142 天津师范大学 36.3
144 长春理工大学 36
144 北京工商大学 36
146 武汉工程大学 35.9
146 天津工业大学 35.9
146 中国计量学院 35.9
149 福建师范大学 35.8
149 安徽师范大学 35.8
149 温州大学 35.8
149 山西师范大学 35.8
153 西南石油大学 35.7
154 济南大学 35.6
154 山东师范大学 35.6
156 江苏科技大学 35.5
156 郑州大学 35.5
156 浙江中医药大学 35.5
159 广州大学 35.4
160 河南大学 35.3
161 重庆邮电大学 35.2
161 辽宁工业大学 35.2
163 安徽工业大学 35.1
163 中国民航大学 35.1
163 辽宁师范大学 35.1
166 中南民族大学 35
167 上海海洋大学 34.9
167 四川农业大学 34.9
169 沈阳建筑大学 34.7
169 广西师范大学 34.7
169 河南理工大学 34.7
169 西北师范大学 34.7
169 集美大学 34.7
174 天津科技大学 34.6
175 南京中医药大学 34.5
175 湖南农业大学 34.5
175 成都理工大学 34.5
175 北方工业大学 34.5
175 海南大学 34.5
180 南通大学 34.4
180 贵州大学 34.4
180 浙江农林大学 34.4
180 云南师范大学 34.4
184 常州大学 34.3
184 北京建筑大学 34.3
184 西安邮电大学 34.3
184 宁夏大学 34.3
184 福建中医药大学 34.3
189 中北大学 34.2
189 兰州交通大学 34.2
191 内蒙古大学 34.1
191 南华大学 34.1
191 河南师范大学 34.1
191 苏州科技学院 34.1
191 大连交通大学 34.1
196 福建农林大学 34
197 陕西科技大学 33.9
197 沈阳农业大学 33.9
197 山东科技大学 33.9
200 兰州理工大学 33.8
200 太原科技大学 33.8
202 长江大学 33.7
202 徐州医学院 33.7
204 重庆工商大学 33.6
205 江西师范大学 33.5
205 青岛理工大学 33.5
207 山东农业大学 33.4
207 绍兴文理学院 33.4
209 武汉轻工大学 33.3
210 辽宁工程技术大学 33.2
210 哈尔滨理工大学 33.2
212 湖南科技大学 33
212 沈阳工业大学 33
212 桂林理工大学 33
212 河北工程大学 33
212 延边大学 33
217 烟台大学 32.8
217 昆明理工大学 32.8
217 中南林业科技大学 32.8
220 山西医科大学 32.7
220 广东医学院 32.7
222 西安石油大学 32.6
222 北京信息科技大学 32.6
222 四川医科大学 32.6
222 山西大同大学 32.6
222 广西民族大学 32.6
227 河南工业大学 32.4
228 河南科技大学 32.3
228 桂林电子科技大学 32.3
228 上海电力学院 32.3
231 南京林业大学 32.2
231 嘉兴学院 32.2
231 大连民族大学 32.2
231 淮阴师范学院 32.2
231 哈尔滨师范大学 32.2
236 大连大学 32.1
236 浙江海洋学院 32.1
238 曲阜师范大学 32
238 大连海洋大学 32
238 常熟理工学院 32
241 四川师范大学 31.9
242 湖南工业大学 31.8
242 石河子大学 31.8
244 大连工业大学 31.7
245 长春工业大学 31.6
245 西南民族大学 31.6
247 辽宁石油化工大学 31.4
247 宁波工程学院 31.4
249 成都中医药大学 31.3
250 南昌航空大学 31.2
250 上海应用技术学院 31.2
250 吉林师范大学 31.2
253 西安工程大学 31.1
254 山西农业大学 30.9
254 沈阳理工大学 30.9
256 河南农业大学 30.8
256 安徽农业大学 30.8
256 广东药学院 30.8
256 辽宁医学院 30.8
260 盐城工学院 30.7
261 华东交通大学 30.6
261 重庆师范大学 30.6
261 山东建筑大学 30.6
261 长春大学 30.6
265 山东理工大学 30.3
265 西南科技大学 30.3
265 安徽理工大学 30.3
265 沈阳大学 30.3
269 西华师范大学 30.2
269 山东中医药大学 30.2
271 广东海洋大学 30.1
272 内蒙古工业大学 29.8
272 洛阳师范学院 29.8
274 西华大学 29.6
274 五邑大学 29.6
274 甘肃农业大学 29.6
277 江西理工大学 29.5
277 云南农业大学 29.5
277 吉林农业大学 29.5
280 淮海工学院 29.3
281 鲁东大学 29.2
282 河南科技学院 29.1
282 贵州医科大学 29.1
282 齐齐哈尔大学 29.1
282 北华大学 29.1
286 淮北师范大学 29
287 成都信息工程大学 28.9
288 青岛农业大学 28.8
288 潍坊医学院 28.8
290 新疆大学 28.6
290 齐鲁工业大学 28.6
292 淮阴工学院 28.5
293 北京联合大学 28.4
293 聊城大学 28.4
295 临沂大学 28.3
295 蚌埠医学院 28.3
297 黑龙江八一农垦大学 28
298 江西农业大学 27.9
299 中原工学院 27.7
299 北京石油化工学院 27.7
301 重庆科技学院 27.6
301 内蒙古科技大学 27.6
303 西南林业大学 27.5
303 贵州师范大学 27.5
305 四川理工学院 27.2
305 新疆医科大学 27.2
307 江西中医药大学 26.4
308 景德镇陶瓷学院 26.1
309 潍坊学院 23.6
310 德州学院 21.5
中国最好大学网爬取大学排名信息相关推荐
- python爬虫+pygal交互式可视化爬取大学QS排名
目录 前言 一.用到的python库 二.准备工作 1.找个有近几年QS排名的网站 2.找到数据 3.分析json结构 三.编写代码 四.结果呈现 总结 前言 不久后要做大学宣讲,顺便捡一下爬虫的语法 ...
- Matlab 从怀俄明大学上爬取探空数据
function sounding %设置爬取时间 49行可以选取早八晚八,默认是都下载 start_year =2019 ; start_month =06 ...
- go爬虫和python爬虫哪个好_python 爬虫实战项目--爬取京东商品信息(价格、优惠、排名、好评率等)-Go语言中文社区...
利用splash爬取京东商品信息 一.环境 window7 python3.5 pycharm scrapy scrapy-splash MySQL 二.简介 为了体验scrapy-splash 的动 ...
- 爬虫-东北林业大学校内-中国[哈尔滨]森林博物馆-爬取所有馆藏蝴蝶图片
爬虫-东北林业大学校内-中国[哈尔滨]森林博物馆-爬取所有馆藏蝴蝶图片 馆藏蝴蝶图片爬虫 直接上代码 馆藏蝴蝶图片爬虫 由于本人很喜欢玩LOL大嘴的帝王斑蝶皮肤,导员下午又发了森林博物馆开馆的通知,于 ...
- python爬虫实战三:近十年中国电影票房数据爬取与分析
近十年中国电影票房数据爬取与分析 前言 爬取 分析 十年top10 年度top5 每年电影数 每年总票房 二八原则 代码与数据 前言 这篇文章主要讲述的是近十年(2010-2019)中国电影票房数据的 ...
- 程序猿必备福利之二上篇!!!简易使用Nodejs实现从美图网爬取清晰脱俗的美图???
当然这里为了能够让小白也能够看懂学会,我会说的很详细,我很体谅小白的哦,分了几篇讲解,请谅解哦 这里先来一波看前美图福利,激起你的学习欲望,嘿嘿嘿!!!点击查看程序猿必备福利之二下篇##### 小白如 ...
- 项目三:近10年来中国电影票房数据爬取分析
近10年来中国电影票房数据爬取分析 前言 数据采集与存储 数据清洗和简单分析 引入库,导入数据 近10年top 年度top5 每年电影数 每年总票房 结论 二八原则 end 点击跳转到总目录 前言 这 ...
- [python]豆瓣网爬取图书图片信息教程
[python]豆瓣网爬取图书图片信息教程 1.准备工作:已经爬取了图片的URL,图书的相关信息,以便后期进行标记. 画圈处为图片链接和图书ID(用于匹配图片) 2.定义url数组和id数组 作用同上 ...
- 【Python爬虫】爬取企业专利信息
本来是个美好的周末的,但是周五晚上领导给了一个公司名称的Excel,让把这些公司的专利信息爬取下来.本文记录了爬取企业专利信息的心酸过程.码字不易,喜欢请点赞!!! 一.找寻目标网页 在接到这个任务之 ...
- day02:requests爬取豆瓣电影信息
一.requests爬取豆瓣电影信息 -请求url: https://movie.douban.com/top250 -请求方式: get -请求头: user-agent cookies二.sele ...
最新文章
- c# 非阻塞算法_c#创建非阻塞tcp通信
- 浅析MongoDB数据库的海量数据存储应用
- Python练习:合格率的计算
- ionic3 html调用摄像头,Ionic3项目实战
- Chapter 3 Phenomenon——6
- php 5.6 mcrypt,mcrypt在Windows / IIS上的PHP 5.6中不起作用
- 怎么修照片多余的部分_眉毛不会画怎么办?眉笔眉粉染眉膏到底怎么选?看完就会了...
- 内核中断,异常,抢占总结篇
- 反编译获取任何微信小程序源码
- 部分更新没有安装 KB4535102
- 班级logo设计分析
- walking与Matlab入门教程-控制walking机器人移动
- Oracle EBS Interface/API(14)-MRP Forcast清空(或删除)所有预测物料
- ul、li 标签实现完美表格
- 技能竞赛国赛_2020高教社杯全国大学生数学建模竞赛常见问题解答
- 1008: 美元和人民币 C语言
- MVC是什么?优点?
- 安防监控系统流媒体服务器,搭建一套安防监控系统RTSP/Onvif网络摄像头视频流媒体服务有哪些核心要素?...
- 量子计算机量子纠缠,最新“量子纠缠”原子使量子计算机更进一步
- 2022全球程序员薪资排行:中国倒数
热门文章
- 在职研一英语课件难句整理
- 回荡口过新年,独特江南水乡年味体验 冰雪非遗贺新年,荡口古镇春节嗨不停!
- 用C语言实现布丰投针计算圆周率问题
- kktv电视剧鸿蒙,KKTV K70系列新品上市 京东、天猫、苏宁易购同步预售
- binlog2sql快速闪回
- python核心技术与实战,Python核心技术与实战——十五|深入了解迭代器和生成器...
- python迭代器与生成器答案,彻底搞懂python 迭代器和生成器
- 写剧本、模仿声音、制造笑点,机器学习进军好莱坞
- oracle按相同年份_英语表达方式有几个类型,时间和日期表达都是不相同的
- 网络加密流量的相关研究