前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

以下文章来源于云+社区,作者 深雾

转载地址

https://blog.csdn.net/fei347795790?t=1

直接运行即可,效果图:

代码如下

导入工具

import requests,os

from pyquery import PyQuery as pq

import time

请求、解析网页数据,保存数据

headers = {

'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 '

'(KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'

}

# 这里我使用了代理 你可以去掉这个代理IP 我是为了后面大规模爬取做准备的

proxies = {

'https': '218.75.69.50:39590'

}

# 请求网页 获取源码

def start_request(url):

r = requests.get(url, headers=headers, proxies=proxies)

# 这个网站页面使用的是GBK编码 这里进行编码转换

r.encoding = 'GBK'

html = r.text

return html

# 解析网页 获取图片

def parse(text,i):

doc = pq(text)

# 锁定页面中的img标签

images = doc('div.list ul li img').items()

x = 1

for image in images:

# 获取每一张图片的链接

img_url = image.attr('src')

# 获得每张图片的二进制内容

img = requests.get(img_url, headers=headers, proxies=proxies).content

# 定义要存储图片的路劲

# 创建目录

dir_path = os.path.dirname(os.path.abspath(__file__)) + "\\image\\"

imagspath = dir_path+'/imgs'+str(i)

# 创建目录

if not os.path.exists(imagspath):

os.makedirs(imagspath)

path = imagspath+"\\" + str(x) + ".jpg"

# 将图片写入指定的目录 写入文件用"wb"

with open(path, 'wb') as f:

f.write(img)

time.sleep(1)

print("正在下载第{}页{}张图片".format(i,x))

x += 1

print("写入完成")

def main():

url = "http://www.netbian.com"

text = start_request(url)

parse(text,1)

#爬取指定范围页面

for i in range(2,100):

urlnum = url + "/index_"+str(i)+".htm"

textnum = start_request(urlnum)

parse(textnum,i)

if __name__ == "__main__":

main()

本文分享 CSDN - 松鼠爱吃饼干。

如有侵权,请联系 support@oschina.cn 删除。

本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

python1080p壁纸高清图片_Python爬取高清桌面壁纸(附源码),直接运行即可相关推荐

  1. python爬取小说并下载_python爬取138看书网小说源码

    python爬取138看书网小说源码由论坛用户制作并分享,适用于138小说网,能够帮助用户爬取网站获取小说资源,软件提供分类搜索查找的功能,支持目录爬取,还附带书签功能,用户使用这款软件能够更加轻松地 ...

  2. scrapy爬取字幕组今日更新影视-附源码

    由于本人比较喜欢看美剧,字幕组的美剧资源更新又是非常快的,而本人scrapy爬虫写的也比较多,同时维护了一个小小的影视站给朋友下载,就想着能不能够用脚本实现每天的字幕组影视资源的更新与抓取,googl ...

  3. python爬取付费直播的视频_教你用20行代码爬取直播平台弹幕(附源码)

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space. ...

  4. python获取虎牙弹幕_教你用20行代码爬取直播平台弹幕(附源码)

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space. ...

  5. python爬取同花顺_Java爬取同花顺股票数据(附源码)

    最近有小伙伴问我能不能抓取同花顺的数据,最近股票行情还不错,想把数据抓下来自己分析分析.我大A股,大家都知道的,一个概念火了,相应的股票就都大涨. 如果能及时获取股票涨跌信息,那就能在刚开始火起来的时 ...

  6. Python运用urllib2和BeautifulSoup爬取网站ZOL桌面壁纸上的精美电脑壁纸

    Python运用urllib2和BeautifulSoup爬取网站ZOL桌面壁纸上的精美电脑壁纸 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Ti ...

  7. python爬虫知乎图片_python 爬取知乎图片

    先上完整代码 1 importrequests2 importtime3 importdatetime4 importos5 importjson6 importuuid7 from pyquery ...

  8. python手机壁纸超清_Python 爬取高清桌面壁纸

    今天写了一个脚本用来爬取ZOL桌面壁纸网站的高清图片: 本程序只爬了美女板块的图片,若要下载其他板块,只需修改程序中的"meinv"即可 代码如下: #coding=utf-8 i ...

  9. python爬虫网页中的图片_Python爬取网页中的图片(搜狗图片)详解

    前言 最近几天,研究了一下一直很好奇的爬虫算法.这里写一下最近几天的点点心得.下面进入正文: 你可能需要的工作环境: 我们这里以sogou作为爬取的对象. 首先我们进入搜狗图片http://pic.s ...

最新文章

  1. ubuntu搭建svn、git遇到的问题及解决办法
  2. iphone11看信号强度_iPhone11信号怎么样_iPhone11信号差原因|解决办法-太平洋IT百科...
  3. 从HBase中移除WAL?3D XPoint技术带来的变革
  4. 随机森林RF、XGBoost、GBDT和LightGBM的原理和区别
  5. 如何快速学好python语言_如何快速的学习Python语言
  6. Hadoop相关问题解决
  7. (转)JVM——内存管理和垃圾回收
  8. 数据可视化之旅(五):常用图表对比
  9. ubuntu wiznote 无法显示内容 只有标题
  10.  Windows socket之IO完成端口(IOCP)模型开发
  11. docker常用命令
  12. 计算机源代码英语,计算机源代码编写规范(国外英文资料).doc
  13. QMainWindow界面添加标题栏
  14. 2020.04 总结分享
  15. 局部敏感哈希算法介绍
  16. 云原生不可变基础设施
  17. PC端播放RTMP流(手机端无法播放)
  18. [集卡游戏]几何分布在竞赛中的应用
  19. nexus on k8s最佳实战
  20. Flutter Sliver大家族之SliverPersistentHeader()和SliverToBoxAdapter()组件(实现固定头布局)③

热门文章

  1. python系统关键字_python基础之常用关键字总结
  2. juqery代码优化
  3. proe输入数字时成双出现_天猫双11花呗可提额,支付宝输入几个数字,试试就知道...
  4. postgres 退出_如何退出postgresql
  5. matlab仿真软件 高阶调制,高阶差分幅度相移键控调制解调系统及仿真
  6. java如何添加子类,java – 防止子类添加方法
  7. 两种语言的html文件,2. 第二章 HTML语言(一)(33页)-原创力文档
  8. webstorm 两个文件对比不同_DOS 入门到精通 使用 fc 命令比较两个文件,并逐一显示不同之处...
  9. Spring的EL表达式
  10. 【sprinb-boot】Junit测试