前言

嗨喽,大家好呀!这里是魔王呐~

环境使用:

  • Python 3.8 解释器
  • Pycharm 编辑器

所使用模块

  • import re
  • import requests >>> pip install requests

如果安装python第三方模块:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
  2. 在pycharm中点击Terminal(终端) 输入安装命令

基本思路流程:

  1. 发送请求
    模拟浏览器 对于url地址发送请求, 获取服务器返回响应数据
    伪装 headers 请求头
  2. 获取数据
  3. 解析数据
    提取我们想要的内容
  4. 保存数据

代码

import requests  # 用来发送请求模块<工具>
import re  # 提取数据工具
for page in range(6, 11):url = f'http://www.netbian.com/index_{page}.htm' # 发送请求# headers 字典数据类型,headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36',}response = requests.get(url=url, headers=headers)response.encoding = 'gbk'   # 获取网页内容,返回出现乱码print(response.text)  # 获取网页源代码# 获取壁纸名字以及壁纸详情页url地址  从什么地方找什么样数据内容,  从response.text 里面找<li><a href="(.*?)"title="(.*?)" target="_blank"># (.*?) 就是我们想要数据html_info = re.findall('<li><a href="(.*?)" title="(.*?)" target="_blank">', response.text)print(html_info)for link, title in html_info:# http://www.netbian.com/desk/27062.htmlink_url = 'http://www.netbian.com' + link  # 字符串拼接response_1 = requests.get(url=link_url, headers=headers)response_1.encoding = 'gbk'# print(response_1.text)img_url = re.findall('<img src="(.*?)" alt=".*?"', response_1.text)[0]img_content = requests.get(url=img_url).contentwith open('img\\' + title + '.jpg', mode='wb') as f:f.write(img_content)print(img_url, title)


尾语

好了,我的这篇文章写到这里就结束啦!

有更多建议或问题可以评论区或私信我哦!一起加油努力叭(ง •_•)ง

喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

别人的六一兴高彩烈,我的六一苦逼的敲代码采集壁纸~相关推荐

  1. 别人7天乐,运维还苦逼值班?

    你被点名值班了吗?或者你的朋友.隔壁七大姑八大姨的侄子被点名值班了吗? 国庆将至,大家都开始研究各种度假攻略了,国内游.国外游.地球游.外星游...然而总有一票人,默默地职守着 -- tIT 公司运营 ...

  2. cadence软件_IC苦逼搬运工入职之——Cadence基本操作(1)

    一入职场深似海,从此微软是路人.作为入职萌新,工作以来最棘手的就是环境问题--这不仅包括枯燥束缚的996,还有IC苦逼搬运工整天对着的Cadence操作软件,真是头大.下面总结几点很实用的操作: 1. ...

  3. 苦逼的程序员怎么发展

    今天组长开会时跟我谈话了,说的意思是我更适合另外一个组,我现在这个组没有什么技术含量,另外一个组技术含量可能更深些. 苦逼啊,这世界缺少的都是耐心,老是用一成不变的模式看人,我是那么还和以前一样沉醉于 ...

  4. 苦逼的程序员幽默之对联恶搞

    看了文章的标题,各位程序员千万别误会,程序员这种死板的生物怎么可能会写对联.下面的这些对联都非常有趣,看到别人这样恶搞自己也不免会淡淡的一笑,哎,苦逼的程序员. 对联一 上联:受苦受累起得比鸡还早. ...

  5. 所谓的牛逼,都是用苦逼换来的

    01 Amy在演讲台上分享她个人的创业经历,主要讲的是她如何从一名普通的广告从业人员,到现在成为活动策划公司的CEO.公司目前在上海很火,承办各大活动,市里的高层领导也曾去参观过.因为公司办得出色,A ...

  6. 这笔投资你算过吗?―写给二本院校的苦逼青年

    说到投资,人们往往首先想到的是商业投资:投入大量的资源(时间和金钱等)到某个项目,期望得到丰厚的回报(利润).而实际上,除了商业,很多事情都可以从投资的角度来理解.就比如上大学,对于大多数人来说,其实 ...

  7. 谋哥:App开发者的苦逼不值得怜悯!

    [谋哥每天一干货,第四十篇]         为什么取这个标题呢?因为昨天一些本来"支持"谋哥的人看到谋哥搞收费VIP群,觉得谋哥赚苦逼开发者的钱很不道德,且说谋哥我写的东西都不切 ...

  8. 测试工程师苦逼时刻,Android 谈谈自动化测试

    前言 最近,手头上的项目基本开发完成,优化也做的差不多了,本以为可以安心准备上线.然而老板却反映说测试人员发现 App 总会出现一些莫名的 bug. 目录 前言 一.概述 二.自动化测试框架 三.云测 ...

  9. 一个苦逼版主的自白书

    我是一名版主,管理着一个不大不小的论坛,同时也是一个中型贴吧的吧主,每天将近一半的时间都奉献给了网络.有人说做版主挺风光,掌握生杀大权,在论坛里呼风唤雨,对于这样的话,我只能送你一句"呵呵& ...

最新文章

  1. AngularJS安装配置与基础概要整理(上)
  2. 特别浅的渐变蓝色在html里,javascript – 渐变色淡淡的3种颜色
  3. mysql查询索引like_mysql 索引与优化like查询
  4. C#从服务器下载文件到客户端源码
  5. lzg_ad:rundll32.exe进程详述
  6. java读取excel2010文件_java如何读写excel2010
  7. python中怎么调用函数_浅谈Python中函数的定义及其调用方法
  8. pycharm remote 远程项目 同步 本地_利器:PyCharm本地连接服务器搭建深度学习实验环境的三重境界...
  9. facebook 开源_Facebook开源主管开放
  10. Vue笔记(四)——Vue动画路由
  11. python是什么类型的编程语言-python是什么编程语言
  12. flask gunicorn gevent部署
  13. hadoop配置启动historyserver
  14. 【经验分享】WPS启用宏
  15. Java基础 day08笔记
  16. 计算机软件图标不正常,桌面图标显示不正常,详细教您桌面图标显示不正常怎么解决...
  17. Freertos基本概念----(猫和老鼠)
  18. nvm管理node版本的使用方法和常用指令
  19. 对于tomcat升级导致游览器访问页面出现的中文乱码问题解决方案
  20. Python五分钟教你制作一个太阳

热门文章

  1. iOS Developer:真机测试证书申请
  2. 【mac】设置的环境变在重启终端后不生效。
  3. 抖音源码隐藏状态栏图标
  4. CKEditor5+vue3使用以及如何添加新工具栏
  5. Chapter 1.伦敦的歌剧魅影 ——《地与光》
  6. 互联网的女性主义特征(姜奇平)
  7. 电脑店、大白菜PE工具去除捆绑软件的方法
  8. 八、影片添加页实现《仿淘票票系统前后端完全制作(除支付外)》
  9. matlab读mp4截图或转gif
  10. 2022年G3锅炉水处理国家题库及在线模拟考试