本来想展示下爬取下来的图片,结果被官方审核未通过,说内容低俗,所以我就不放图了,可以自己去跑一下,开车了,哈哈,感觉不怎么低俗吧,害,上代码!

import requests
from lxml import etree
import time
url='https://www.huya.com/g/4079/'
header={'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.162 Safari/537.36'
}
response=requests.get(url=url,headers=header)#发送请求
# print(response.text)
data=etree.HTML(response.text)#转化为html格式
image_url=data.xpath('//a//img//@data-original')
image_name=data.xpath('//a//img[@class="pic"]//@alt')
# print(image_url)
path='E://photo//'
for ur,name in zip(image_url,image_name):url=ur.replace('?imageview/4/0/w/338/h/190/blur/1','')title=name+'.jpg'response = requests.get(url=url, headers=header)  # 在此发送新的请求with open(path+title,'wb') as f:f.write(response.content)print("下载成功" + name)time.sleep(2)

我最近才学到xpath吧,所以就用的xpath,前面我已经用过正则做过类似的爬取了,其实发现爬虫真的不难
这是我私人群:970353786喜欢python的可以跟我一起交流,我也正在努力学习中。

爬虫学习(11):爬取虎牙美女直播高清照片相关推荐

  1. Python爬虫学习笔记 -- 爬取糗事百科

    Python爬虫学习笔记 -- 爬取糗事百科 代码存放地址: https://github.com/xyls2011/python/tree/master/qiushibaike 爬取网址:https ...

  2. Python爬虫学习之爬取淘宝搜索图片

    Python爬虫学习之爬取淘宝搜索图片 准备工作 因为淘宝的反爬机制导致Scrapy不能使用,所以我这里是使用selenium来获取网页信息,并且通过lxml框架来提取信息. selenium.lxm ...

  3. 利用Scrapy框架爬取LOL皮肤站高清壁纸

    利用Scrapy框架爬取LOL皮肤站高清壁纸  Lan   2020-03-06 21:22   81 人阅读  0 条评论 成品打包:点击进入 代码: 爬虫文件 # -*- coding: utf- ...

  4. Python 3.5_简单上手、爬取百度图片的高清原图

    利用工作之余的时间,学习Python差不多也有小一个月的时间了,路漫漫其修远兮,我依然是只菜鸟. 感觉学习新技术确实是一个痛并快乐着的过程,在此分享些心得和收获,并贴一个爬取百度图片原图的代码. 代码 ...

  5. Python批量爬取王者荣耀英雄高清壁纸

    Python批量爬取王者荣耀英雄高清壁纸 文章目录 Python批量爬取王者荣耀英雄高清壁纸 前言 爬虫步骤 python代码实现 总结 前言 很多喜欢玩王者的朋友很希望把王者荣耀的英雄图片拿来做壁纸 ...

  6. python爬取王者荣耀皮肤高清图

    python爬取王者荣耀皮肤高清图 前期准备,导入模块 requests json os 进入王者荣耀官网,进入游戏壁纸页面,f12进入开发者模式,按照下图找到这个json文件,用于对图片的数据请求. ...

  7. Python 爬取百度图片的高清原图

    # coding=utf-8 """ 爬取百度图片的高清原图 Author : MirrorMan Created : 2017-11-10 ""&q ...

  8. python协程多任务爬取虎牙美女主播图片

      使用正则.协程多任务爬取虎牙海量美女图片,斗鱼也一样,只需将正则表达式中的内容换一下即可,由于斗鱼网站的变化,之前的正则已用不了,现贴出新的: re.findall(r"https:// ...

  9. 笨方法学 python3 豆瓣_python3 爬虫学习:爬取豆瓣读书Top250(一)

    本节课,我们试着来写一个基础的爬虫,来爬取一下豆瓣读书top250的内容:主要涉及的知识就是我们之前讲过的requests库. 网页分析 我们先选取一个待会准备爬取的网站,咱们选个较好爬的网页,豆瓣读 ...

最新文章

  1. [Hadoop in China 2011] 何鹏:Hadoop在海量网页搜索中应用分析
  2. java 图片上传
  3. Linux下rgmii接口与fpga相连,FPGA控制RGMII接口PHY芯片88E1512网络通信
  4. 某一年某一年_一年关于开放组织的对话
  5. python装逼_能够让你装逼的10个Python小技巧
  6. bzoj 4624 农场种植 fft
  7. 自己定义View学习之12/7(进度条之混合模式)
  8. 处理器性能越来越强,但电脑为什么没有手机流畅?
  9. Python的一些单行代码(摘抄)
  10. axure rp编辑html模板,AxureRP教程—用模板封装UI标准
  11. 爬虫 (7)—— 爬取网络小说,详细分析及代码
  12. Bioedit 使用
  13. mysql-8.0.16-winx64的最新安装教程
  14. Java面经:小米暑期实习+秋招真题分享
  15. 游戏开发入门(二)游戏开发概述
  16. 钉钉JSAPI鉴权,解决报错“签名校验无效”
  17. 一边攒大米,一边做公益
  18. 77%的本科毕业生起薪超过1万元,程序员的薪资到底有多高?
  19. 计算机毕业设计(3)python毕设作品之小说电子书阅读系统
  20. Bias(偏差),Variance(方差),Error(误差)

热门文章

  1. gitlab 项目页500错误 OpenSSL bad decrypt
  2. python3.9下载_Python-3.9下载_Python下载_Python最新版_5分享
  3. 教师综合素质7--文学常识
  4. 【Java WEB-001】使用JSTL步骤+常用的核心标签
  5. 职业规划九—it行业几条不同的路
  6. 路由侠启动后是灰色的,然后切换用户后重新登录显示 -/- 的解决方法
  7. 室内装修墙面处理(刷漆)的一般步骤
  8. [Simulink] 基于模型的测试与验证学习笔记_Step 3: Detecting Desig Errors
  9. ant design mobile listView 使用
  10. Word2Vec原理详解