需求:
获取斗图啦第一页所有图片,并将图片下载到本地
导入requests等

import requests
import os
from lxml import etree

定义请求头

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}

发起请求,接收响应

response = requests.get(url='https://www.doutula.com/photo/list/',headers=headers)
# print(response.text)

将字符串转换成html对象

html = etree.HTML(response.text)

使用xpath提取数据
先获取a标签

a_list = html.xpath('//div[@class="page-content text-center"]/div/a[@class="col-xs-6 col-sm-3"]')
# print(a_list)
path = 'F:\Python夏令营\斗图啦\\'  # 新建文件夹,将下载的图片存入
os.mkdir(path)
for a in a_list:
# 获取表情包网址jpg = a.xpath('./img/@data-original')[0]  # 获取表情包网址# print(jpg)jpg_response = requests.get(url=jpg)  # 接收表情包请求
# 获取表情包名称name = a.xpath('./p[@style="display: none"]/text()')[0]# print(name)# 保存文件with open(path+'{}.jpg'.format(name),'wb') as fp:fp.write(jpg_response.content)

聚焦爬虫案例4:斗图啦相关推荐

  1. C# 简单图片爬虫 快来斗图把

    爬取后的图片默认在bin/debug/File下面 using System; using System.Collections.Generic; using System.IO; using Sys ...

  2. 聚焦爬虫案例1:股吧

    需求: 获取股吧热门信息(阅读数.评论数.标题.作者.更新时间) 导入requests,re import requests,re 定义请求头 headers = {'User-Agent': 'Mo ...

  3. 跟我斗图,我用Python爬虫下载几个G的表情砸死你

    有一个网站,叫做"斗图啦",网址是:https://www.doutula.com/.这里面包含了许许多多的有意思的斗图图片,还蛮好玩的.有时候为了斗图要跑到这个上面来找表情,实在 ...

  4. 斗图表情包爬虫(基于多线程)

    今天写一下关于多线程的爬虫,这次我们爬取的是斗图网站的表情包. 一. 思路: 1.对网站翻页链接进行分析,发现链接为:"http://www.doutula.com/article/list ...

  5. 【爬虫】Yhen手把手教你爬取表情包,让你成为斗图界最靓的仔!

    以下内容为本人原创,欢迎大家观看学习,禁止用于商业用途,转载请说明出处,谢谢合作! ·作者:@Yhen ·原文网站:CSDN ·原文链接:https://blog.csdn.net/Yhen1/art ...

  6. python多线程爬取多个网址_【Python爬虫】多线程爬取斗图网站(皮皮虾,我们上车)...

    原标题:[Python爬虫]多线程爬取斗图网站(皮皮虾,我们上车) 斗图我不怕 没有斗图库的程序猿是无助,每次在群里斗图都以惨败而告终,为了能让自己在斗图界立于不败之地,特意去网上爬取了斗图包.在这里 ...

  7. Python爬虫系列(三)多线程爬取斗图网站(皮皮虾,我们上车)

    斗图我不怕 最近看了Python多线程的相关内容,并且前几天观看了腾讯课堂潭州学院上面的关于斗图网爬取的公开课,课程内容大致是利用Python多线程爬取斗图(多页),并将图片保存到本地.自己写这篇文章 ...

  8. 【python--爬虫】斗图啦表情包爬虫

    前言 你还在,你还在,头悬梁锥刺股. 下,下,下,表情包吗? 你还以为盗个图战胜小学生. 就能成为斗图王吗? 你还把会做图当成斗图资本吗? 你还为斗不过图而痛哭流泪吗? No no no no no ...

  9. python表情包斗图_Python爬虫入门教程 13-100 斗图啦表情包多线程爬取

    斗图啦表情包多线程爬取-写在前面 今天在CSDN博客,发现好多人写爬虫都在爬取一个叫做斗图啦的网站,里面很多表情包,然后瞅了瞅,各种实现方式都有,今天我给你实现一个多线程版本的.关键技术点 aioht ...

最新文章

  1. 用PROCEDURE ANALYSE优化MYSQL表结构
  2. PMCAFF微课堂 | 阿里高级产品专家: 揭秘B类App如何在高速生长期凝结含金量
  3. hadoop学习1 java操作HDFS
  4. 前端学习(3068):vue+element今日头条管理-上午总结
  5. 数据结构前缀,后缀,中缀表达式
  6. axure form列表_常见的列表页如何用Axure画出来
  7. Error running ‘Unnamed‘: Unable to open debugger port (127.0.0.1:xxxx)
  8. VS2017 启动调试出现 无法启动程序“http://localhost:15613” 操作在当前状态中是非法的。 同时附加进程也是错误的解决方法
  9. 7-2 搜索树判断 (25 分)
  10. MVC系列博客之排球计分(六)Controller的实现(二)
  11. 只有极少数人能通过的「超级多任务」测试(文末附测试地址)
  12. cad2010多个文件并排显示_CAD软件同时显示两张或多张图纸的方法
  13. 2019互联网寒冬期IT大牛不容错过的泰牛程序员PHP系列高级教程
  14. vc++键盘钩子和鼠标钩子
  15. 如何设计微信公众号的封面图?教你设计自己的专属公众号封面
  16. safri手机页面调试
  17. [经验教程]中国民生银行信用卡积分怎么兑换免费腾讯视频VIP会员?
  18. mysql如何上传音频文件_如何上传本地音乐获取MP3外链(欢迎分享和转载)
  19. 搭建智慧农业物联网云平台——基于阿里云物联网平台构建
  20. LDA隐狄利克雷分配

热门文章

  1. linux 内核编译_如何在21世纪编译Linux内核
  2. java三大变量——静态变量、实例变量、局部变量
  3. 影响计算机算法世界的十位大师
  4. spring boot 单元测试的使用和一些坑
  5. PS 十六进制颜色对照表
  6. 【ML】【HMM】【转】隐马尔可夫模型(HMM)简介
  7. 半透明背景Activity实现AlertDialog弹窗效果
  8. Word控件Spire.Doc 【Table】教程(1):在 Word 中创建表格-C#VB.NET
  9. 两分钟窃取身边女神微博帐号?详解Android App AllowBackup配置带来的风险
  10. c语言 一个函数返回结构体指针,详解C语言结构体中的函数指针