使用requests库和BeautifulSoup库实现对最好大学网大学排名信息爬取

链接:http://www.zuihaodaxue.com/Greater_China_Ranking2019_0.html

代码:

import requests
from bs4 import BeautifulSoup
import bs4#从网络上获取大学排名网页内容
def getHTMLText(url):try:r =requests.get(url,timeout=30)r.raise_for_status()r.encoding = r.apparent_encodingreturn r.textexcept:return ""#提取网页内容中信息到合适的数据结构
def fillUnivList(ulist,html):soup = BeautifulSoup(html,"html.parser")for tr in soup.find('tbody').children:if isinstance(tr,bs4.element.Tag):tds = tr('td')ulist.append([tds[0].string,tds[1].string,tds[3].string])#利用数据结构展示并输出结果
def printUnivList(ulist,num):tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"print(tplt.format("排名","学校名称","总分",chr(12288)))for i in range(num):u = ulist[i] print(tplt.format(u[0],u[1],u[2],chr(12288)))def main():uinfo = []url = 'http://www.zuihaodaxue.com/Greater_China_Ranking2019_0.html'html = getHTMLText(url)fillUnivList(uinfo,html)printUnivList(uinfo,20)main()

本文为学习北京理工大学爬虫mooc跟着敲得实例代码.附上链接:https://www.bilibili.com/video/av9784617?from=search&seid=17441199644632730564

使用python爬虫爬取最好大学网大学排名实例相关推荐

  1. python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  2. Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  3. 使用python爬虫爬取卷皮网背包信息实例

    使用requests和BeautifulSoup实现对卷皮网背包名称与价格的爬取 链接:www.juanpi.com 代码: import requests import re from bs4 im ...

  4. python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  5. python爬虫爬取彼岸图网图片

    python爬虫爬取彼岸图网图片 话不多说,直接上代码! import requests from PIL import Image from io import BytesIO import re ...

  6. python 爬虫爬取煎蛋网妹子图,我1T的硬盘装满了!

    前言 大家好,这里是「brucepk」爬虫 系列教程.此系列教程以实例项目为材料进行分析,从项目中学习 python 爬虫,跟着我一起学习,每天进步一点点. 煎蛋网站 image 很多朋友都反应学 p ...

  7. (6)Python爬虫——爬取中新网新闻

    工欲善其事,必先利其器.我们要进行数据挖掘,就必须先获取数据,获取数据的方法有很多种,其中一种就是爬虫.下面我们利用Python2.7,写一个爬虫,专门爬取中新网http://www.chinanew ...

  8. Python爬虫爬取ok资源网电影播放地址

    #爬取ok资源网电影播放地址#www.okzy.co #入口一:http://okzy.co/index.php?m=vod-search&wd={关键字}&submit=search ...

  9. Python Scrapy 爬取煎蛋网妹子图实例(一)

    前面介绍了爬虫框架的一个实例,那个比较简单,这里在介绍一个实例 爬取 煎蛋网 妹子图,遗憾的是 上周煎蛋网还有妹子图了,但是这周妹子图变成了 随手拍, 不过没关系,我们爬图的目的是为了加强实战应用,管 ...

  10. Python爬虫爬取某小说网的教程(含全代码)#大佬勿喷

    1.主要使用三个库 import parsel import requests import os 2.利用parsel解析网页 3.利用os库保存一本小说 4.链接上 小说专题: https://w ...

最新文章

  1. 谷歌最新发布数据集:Open Images V6 来了!新增局部叙事标注形式
  2. sjms-3 结构型模式
  3. 【Tomcat】如何解决catalina.out文件过大的问题
  4. WEB前端学习四 js什么是原始类型
  5. python 细枝末节
  6. OCA第2部分中的Java难题
  7. 你不知道的JS5-原型
  8. mysql中怎么在列中使用时间函数_mysql中关于时间的函数使用教程
  9. 修改同一张表的同一个字段的两个不同的值。
  10. 下方向键_求助:Deepin-linux-opencv方向键
  11. 深度学习笔记——生成模型
  12. 苹果CMS V10 播放记录_苹果cms采集后无法播放怎么解决?
  13. 微软面试4、在二元树中找出和为某一值的所有路径
  14. 智能优化算法总结-数字孪生下的车间调度-APS预告
  15. 马云达沃斯金句:蠢是最大的疾病 比癌症还坏
  16. C# WinForm程序中使用Unity3D控件
  17. SQL-92标准 中文翻译
  18. mysql查询特定时间段内的数据_mysql查询特定时间段内的数据
  19. 一文了解驱动程序及更新方法
  20. 外卖cps返利定制开发源码平台小程序美团饿了么红包电影票券分销

热门文章

  1. 大数据中一些常用软件
  2. Ubuntu 微信QQ企业微信不能输入中文
  3. python图像处理《数字图像处理与python实现》读书笔记二:空间滤波
  4. 鸿蒙os系统的iphonexr,现在买iPhoneXR还合适吗?过来人的忠告:看清这3点再做决定!...
  5. STM32学习笔记(一)——如何下载程序到STM32单片机
  6. 操作系统中pv操作用c语言,操作系统-pv操作.doc
  7. Spring - InstantiationAwareBeanPostProcessor 扩展接口
  8. 安卓onKeyDown事件
  9. 创意相册、3D立体相册
  10. h5 实现公众号登录