源代码:

import requests
from bs4 import BeautifulSoup
import bs4def getHTMLText(url):try:r = requests.get(url,timeout = 30)r.raise_for_status()r.encoding = r.apparent_encodingreturn r.textexcept:return ""def fillUnivList(ulist,html):soup = BeautifulSoup(html,"html.parser")for tr in soup.find('tbody').children:if isinstance(tr, bs4.element.Tag):tds  =  tr('td')ulist.append([tds[0].string,tds[1].string,tds[2].string])def printUnivList(ulist, num):print("{:^10}\t{:^6}\t{:^10}".format("排名", "学校名称", "总分"))for i in range(num):u=ulist[i]print("{:^10}\t{:^6}\t{:^10}".format(u[0], u[1], u[2]))#print("Suc"+str(num))
def main():uinfo = []url = 'http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html'html = getHTMLText(url)fillUnivList(uinfo, html)printUnivList(uinfo, 20)
main()



运行结果:

总分那一项,没输出正确。
修改这里就可以了吧。因为对应的标签的序号是第四个。


程序的结构设计
步骤1:从网络上获取大学排名网页内容
getHTMLText()
步骤2:提取网页内容中信息到合适的数据结构
fillUnivList()printUnivList()

步骤3:利用数据结构展示并输出结果
printUnivList()

课程地址:https://www.icourse163.org/learn/BIT-1001870001?tid=1003245012#/learn/content?type=detail&id=1004574446&cid=1005754042

python实例,python网络爬虫爬取大学排名!相关推荐

  1. 用Python写一个网络爬虫爬取网页中的图片

    写一个爬虫爬取百度贴吧中一个帖子图片 网址:壁纸 用谷歌浏览器的开发工具检查网页,可以发现其每一张图片都有如下格式 <img class="BDE_Image" src=&q ...

  2. Python实例:网络爬虫抓取豆瓣3万本书(1)

    花了些时间看了Python一整本书,写了些小例子,因为是有经验的人自学,所以很多都是跳过的. 不过学习还是得在实践中去,学一门语言还得运用中去. 去下一些例子下来,去运行,调试时最好的了. <网 ...

  3. python爬虫爬取大学排名并存入数据库进行数据可视化

    这是本人的期末大作业,题目要求如下: 对中国大学专业排名网站中2021年,计算机科学与技术专业,进行数据爬取和数据可视化. URL地址:https://www.shanghairanking.cn/r ...

  4. Python实例:网络爬虫抓取豆瓣3万本书(9)

    代码在这里:点击打开链接 这个实例是作者的一次课程设计.虽然内容不咋的,但是作为课程设计,我还是很惊讶的了. 至少我以前没做过这种程度的课程设计.当然实习和毕业设计除外. 再总结一下吧. 1.知识点在 ...

  5. Python实例:网络爬虫抓取豆瓣3万本书(5)

    第五步没有什么心的知识点. 直接看代码吧. # -*- coding:utf-8 -*- # 提取各标签列表页到excel import time import os.path from tool.E ...

  6. python网络爬虫_Python网络爬虫——爬取视频网站源视频!

    原标题:Python网络爬虫--爬取视频网站源视频! 学习前提 1.了解python基础语法 2.了解re.selenium.BeautifulSoup.os.requests等python第三方库 ...

  7. 如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)

    前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...

  8. python朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)

    前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...

  9. python抓取朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)...

    原标题:如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下) 前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往 ...

最新文章

  1. bezier曲线_Bezier算法
  2. Linux如何在系统启动时自动加载模块
  3. 如何给5岁孩子解释DCT?
  4. IOS开发基础之使用AFNetworking框架实现xml文件的解析
  5. selenium的页面等待
  6. 一文带你了解GaussDB(DWS) 的Roach逻辑备份实现原理
  7. Jmeter跨线程组调用变量
  8. hdu 1232 经典并查集应用
  9. 凸优化学习笔记(一):仿射集、凸集、锥
  10. cad2016中选择全图字体怎么操作_在学习CAD的过程中,经常会遇到的10个问题,你遇到过吗...
  11. WinRAR下载官方免费版
  12. qq说说时间轴php实现,qq空间时间轴 PHP实现时间轴函数代码
  13. Windows无法安装到GPT格式磁盘的根本解决办法 - 初学者系列 - 学习者系列文章...
  14. sap中如何追踪生产订单的修改记录
  15. H3C交换机型号区分
  16. 中国商业重点产品追溯管理平台
  17. 鸿蒙os2.0主页,华为鸿蒙os2.0系统支持的手机型号,华为鸿蒙系统官方下载入口
  18. nps+Proxifier搭建socks5代理隧道进行内网穿透
  19. 治疗脚气、脚臭偏方!
  20. 程序猿小哥用12万行代码堆出来个「蔡徐坤」!编译竟然还能通过

热门文章

  1. Python数据清理终极指南(2020版)
  2. 论推荐系统与精细化运营
  3. 抗击疫情!阿里云为加速新药疫苗研发提供免费AI算力
  4. 那些年,让我面试头大的几个排序算法,今天终于搞懂了!
  5. 程序员再也不能埋头敲代码了
  6. 一键fxxk,代码修复神器拯救你
  7. 景驰科技又生闹剧?法人代表潘思宁将CFO吕庆诉至法院
  8. 百分点集团发布中国首个行业AI决策系统产品Deep Matrix
  9. 实战:使用Nginx限流
  10. 聊聊 SpringCloud 中的父子容器