今天,因为某种需要,要对国外大学排行榜进行数据的爬取。所以,对那个网站的一些数据进行的了爬取。

对爬取到的数据进行存储到mysql数据库中。

网站地址:点击打开链接

# _._ coding:utf-8 _._#
import lxml
from lxml import etree
import requests
import MySQLdb# 打开数据库连接
db = MySQLdb.connect("xxxx","xxxx","xxxx","xxxx" )
#设置数据库编码
db.set_character_set('utf8')
# 使用cursor()方法获取操作游标
cursor = db.cursor()headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36'
}
r = requests.get(url='https://www.usnews.com/education/best-global-universities/search?region=&subject=&name=',headers=headers)
html = r.text.encode('utf-8')
# result = etree.tostring(html, pretty_print=True)
# print result
result = etree.HTML(html)
# # print result
# seq1 = []allPage = result.xpath('//div[@class="pagination"]//a[last()-1]')
sumPage = allPage[0].textsubjects_list = []
select = result.xpath('//select[@name="subject"]')
allOptions = select[0].xpath('

USnews 国外排行榜 爬取数据相关推荐

  1. python抓取数据时失败_爬取数据缺失的补坑,Python数据爬取的坑坑洼洼如何铲平...

    渣渣业余选手讲解,关于爬取数据缺失的补坑,一点点关于Python数据爬取的坑坑洼洼如何铲平,个人的一些心得体会,还有结合实例的数据缺失的补全,几点参考,仅供观赏,如有雷同,那肯定是我抄袭的! 在使用P ...

  2. JAVA爬虫(一):豆瓣电影排行榜爬取

    JAVA爬虫(一):豆瓣电影排行榜爬取 前言 流程图 步骤 一.爬取豆瓣电影榜单网页源代码 二.网页源码解析 三.爬取单个电影网页源码 四.源代码解析及关键信息获取 前言 最近和大创队友一起给大创做的 ...

  3. monthy python爬虫_Python爬虫DOTA排行榜爬取实例(分享)

    Python爬虫DOTA排行榜爬取实例(分享) 1.分析网站 打开开发者工具,我们观察到排行榜的数据并没有在doc里 doc文档 在Javascript里我么可以看到下面代码: ajax的post方法 ...

  4. JAVA爬虫(二):哔哩哔哩动画搞笑排行榜爬取

    JAVA爬虫(二): 哔哩哔哩动画搞笑视频排行榜爬取 1. 前言 2. 步骤 2.1 分析及网页源代码爬取 2.1.1 分析 2.1.2网页源代码爬取 2.2 网页源代码解析 3. 总代码 1. 前言 ...

  5. python爬取新闻并归数据库_Python爬取数据并写入MySQL数据库操作示例

    Python爬取数据并写入MySQL数据库的实例 首先我们来爬取 http://html-color-codes.info/color-names/ 的一些数据. 按 F12 或 ctrl+u 审查元 ...

  6. python requests 爬取数据

    python requests 爬取数据 import requests from lxml import etree import time import pymysql import json h ...

  7. python3爬取数据存入mysql_Python如何爬取51cto数据并存入MySQL

    实验环境 1.安装Python 3.7 2.安装requests, bs4,pymysql 模块 实验步骤1.安装环境及模块 2.编写代码 ? 1 2 3 4 5 6 7 8 9 10 11 12 1 ...

  8. Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索

    Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索 一.资源 为什么接下来的代码中要使用el.getElementsByTa ...

  9. python爬去百度文库_利用Python语言轻松爬取数据[精品文档]

    利用 Python 语言轻松爬取数据 对于小白来说,爬虫可能是一件非常复杂. 技术门槛很高的事情. 比如有人认为学爬虫必须精通 Python ,然后哼哧哼哧系统学习 Python 的每个知识点,很久之 ...

最新文章

  1. java数据结构库函数_Java8 内置函数(api)总结
  2. YOLO:将yolo的.weights文件转换为keras、tensorflow等模型所需的.h5文件的图文教程
  3. 说实话,电脑存储空间大了之后对于你的能力有很大的要求
  4. mysql常用的视图_MySQL视图
  5. 计算机应用用什么样的笔记本,制图用什么笔记本好
  6. [干货来袭]MSSQL Server on Linux预览版安装教程(先帮大家踩坑)
  7. 表单下拉框、表单修饰符(.lazy、.number、.trim)
  8. 腾讯互娱开源分布式开发框架 Pebble
  9. xp访问服务器显示没有权限,xp无法访问2008R2共享
  10. Android颜色选择器库
  11. 百度地图订单分布php,php与百度地图API实现注册用户分布图
  12. Java大数据-Week2-Day2面向对象进阶
  13. 色彩的对比度和饱和度_使用高色彩对比度进行更方便的设计
  14. 多媒体技术知识点整理
  15. mxchip EWM3166串口转WIFI AT指令设置
  16. 网页截图怎么截一整张_如何网页截图?(截长图)
  17. max pooling 和 average pooling
  18. 深空天体反差指数计算
  19. 转载:做正确的事情,等着被开除(Do the right thing, Wait to get fired)
  20. GET,POST和PUT的区别

热门文章

  1. 电脑启动 状态 0xc00000e9
  2. Python练习——利用递归方法求!5(递归函数)
  3. 字节跳动OpenDay--填饱肚子、装满大脑
  4. Matlab中的自然对数e
  5. 看什么看啊,你不会还不会抓HTTPS请求报文吧?
  6. 移动硬盘显示无法访问由于IO设备错误,无法运行此项请求,里面的文件怎么恢复
  7. java覆盖率怎么包含多个工程,在多项目工程中统计子工程的覆盖率
  8. C#中any()的用法
  9. stylus的使用和基础知识
  10. 大数据“拉网捕鼠” 博时基金马乐深圳受审