此次实战用到了的模块为requests、re、os。

  • 一、源码
  • 二、在学习过程中可能会遇到的问题
    • 问题1:正则表达式无法识别,什么都爬取不到

一、源码

import requests
import re
import osif not os.path.exists("./美图"):os.mkdir('./美图') # 当前路径下没有名为"美图"的文件夹则创建for p in range(2,5):headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36 Edg/97.0.1072.62 "}url="https://pic.netbian.com/4kdongman/index_{}.html".format(p) response1 = requests.get(url, headers=headers)content1 = response1.textimg_list=re.findall(r'img src="(.*?jpg)"', content1, re.S)url_img="https://pic.netbian.com"for i in range(len(img_list)):URL=url_img+img_list[i]print(URL)response2=requests.get(url=url_img,headers=headers)content2=response2.contentfilename="./美图/"+URL.split("/")[-1] # 取最后一个/后的数字串作为图片的名字,不易重复with open(filename,"wb") as fp:fp.write(content2)print("第{}页爬取完成".format(p))

二、在学习过程中可能会遇到的问题

问题1:正则表达式无法识别,什么都爬取不到

这个还真没什么好办法,只有多尝试去写正则表达式,并且写的正则表达式不要写太长,越长越容易出错,多试几次就能够成功了,也可以去别的大佬的文章下面观摩一下大佬们的代码是怎么写的。

【爬虫剑谱】二卷2章 实战篇-精美动漫图片爬取并保存相关推荐

  1. 爬虫剑谱第十页(关于拼多多商品信息的爬取<修改版>)

    关于此前发布了一篇关于爬取拼多多商品信息的博客:爬虫剑谱第七页(输入关键词爬取拼多多商品信息并进行保存)_独一无二的李狗蛋儿的博客-CSDN博客出现了问题,运行结束后无法返回数据,up主在这里重新进行 ...

  2. 【爬虫剑谱】二卷7章 实战篇-搭建IP代理池绕过反爬检测

    Python\网络爬虫\IP代理 一.源代码 二.实战总结 1.如何生成API链接 2. 如何获取API生成的IP 三.参考文献 一.源代码 import requests import random ...

  3. 【爬虫剑谱】二卷4章 实战篇-模拟登录铁路12306网站(滑块验证)

    Python\网络爬虫\Selenium 一.源码 二.实战总结 问题一:不愿意代码模块化(常见于我这种菜狗+懒狗) 三.参考文献 一.源码 from selenium import webdrive ...

  4. Python 爬虫 爬取豆瓣Top 250 并将海报图片爬取下来保存

    本文章的所有代码和相关文章, 仅用于经验技术交流分享,禁止将相关技术应用到不正当途径,滥用技术产生的风险与本人无关. 本文章是自己学习的一些记录. 爬取豆瓣top 250 现在的很多学习的教程例子都是 ...

  5. 【Python网络爬虫实战篇】使用selenium+requests爬取下载高清源视频:关于爬取m3u8文件链接解析为ts视频合并成mp4视频的分析实战

    这两天博主在摸鱼时,偶然间接触到了流媒体的概念,一时间来了兴致.再加上之前博主有着七.八年的视频制作经验,深知视频素材获取的不易.因此,打算利用自己所学的python网络爬虫的知识,通过编写代码实现获 ...

  6. Python爬虫入门教程【4】:美空网未登录图片爬取

    美空网未登录图片----简介 上一篇写的时间有点长了,接下来继续把美空网的爬虫写完,这套教程中编写的爬虫在实际的工作中可能并不能给你增加多少有价值的技术点,因为它只是一套入门的教程,老鸟你自动绕过就可 ...

  7. Scrapy实战篇(一)之爬取链家网成交房源数据(上)

    今天,我们就以链家网南京地区为例,来学习爬取链家网的成交房源数据. 这里推荐使用火狐浏览器,并且安装firebug和firepath两款插件,你会发现,这两款插件会给我们后续的数据提取带来很大的方便. ...

  8. scrapy爬取天气存MySQL_Scrapy实战篇(五)之爬取历史天气数据

    本篇文章我们以抓取历史天气数据为例,简单说明数据抓取的两种方式: 1.一般简单或者较小量的数据需求,我们以requests(selenum)+beautiful的方式抓取数据 2.当我们需要的数据量较 ...

  9. Python爬虫实战使用scrapy与selenium来爬取数据

    系列文章目录 实战使用scrapy与selenium来爬取数据 文章目录 系列文章目录 前言 一.前期准备 二.思路与运行程序 1.思路 2.运行程序 三.代码 1.代码下载 2.部分代码 总结 前言 ...

最新文章

  1. Cell子刊:源自微生物群的醋酸盐能够在健康和疾病期间促进大脑先天免疫系统的代谢适应性...
  2. SAP MM 预留单据的历史修改记录?
  3. Mybatis的jdbc参数设置
  4. SSIS添加分区-动态
  5. JdbcTemplate(操作数据库-查询返回值)
  6. Linux系统编程31:进程信号之什么是信号的阻塞及相关术语(递达,未决,pending位图,handler位图)
  7. 在Word中如何实现后退?
  8. Kotlin学习笔记 第四章Kotlin调用Java
  9. mysql 自动备份_如何将mysql备份自动存储到minio
  10. C++ 多线程下的单例模式
  11. c c++ 宏定义中#, ##, #@的含义
  12. 8051单片机Proteus仿真与开发实例-RS485协议通信仿真
  13. 【012】基于51单片机的可燃气体报警装置proteus仿真与实物设计
  14. 牛排生熟程度 英语说法
  15. 5G安全_核心网业务
  16. Some useful linux commands
  17. 网络变压器作用(续):T件和扼流圈(K件)组成的网络变压器及其作用
  18. App推广拉新的6大方式,你都玩得转吗?
  19. SpringCloud学习记录 | 第十五篇:SpringCloud Alibaba Nacos集群版
  20. 【知乎问题】如何让不懂编程的人感受到编程的魅力?

热门文章

  1. 【实践】Embedding在腾讯应用宝的推荐实践
  2. Facebook广告系统及多账号操作经验分享
  3. Star Schema完全参考手册读书笔记三
  4. Leetcode每日一题:9.palindrome-number(回文数)
  5. LeetCode刷题(42)--Subsets
  6. java特殊字符转义html_java转义html特殊字符
  7. 学习python这门课的感受_关于我学习了编程小白的第一本Python入门书之后的感受 200110900207...
  8. eclipse创建springBoot工程
  9. [Spring+Hibernate系列] 3.开发环境快速Ant 部署
  10. 毕业生,管好你的档案和户口