python爬取某网站图片
程序运行需要导包 具体看代码中的,缺啥导啥✌
。
import requests
import re
import time
import os
url="https://pic.netbian.com/4kmeinv/index.html"
header={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:92.0) Gecko/20100101 Firefox/92.0","Accept-Language":" zh-CN,zh;q=0.9","Accept":" text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9","Host":" pic.netbian.com","Accept-Encoding":" gzip, deflate"
}
###################下载后文件保存的位置修改关键位置即可
path='C:\\Users\\lyd\\Desktop\\彼岸图库\\'
os.makedirs(path,exist_ok=True)
####################################################
page=int(input("请输入要下载的页数(即从第一页开始):"))
for page_ in range(page):if page_>0:url = f"https://pic.netbian.com/4kmeinv/index_{page_}.html"res = requests.get(url, header)res.encoding = res.apparent_encodingtry:json_text = re.findall("<li>(.*?)</li>", res.text)except:print("程序出错!正在退出。。。。。。")breakdata = json_text[5:len(json_text)]for i in data:i = i.replace("href=", "").replace("src=", "").replace('"', "").replace("alt=", "")i_url = i.split(" ")url_title = "https://pic.netbian.com" + i_url[1]res_image = requests.get(url_title, header)res_image.encoding = res_image.apparent_encodingtitle = re.findall('<div class="photo-hd"><h1>(.*?)</h1></div>', res_image.text)[0].replace(" ", "_")image_url = re.findall('id="img"><img src="(.*?)" data', res_image.text)[0]image_url = "https://pic.netbian.com" + image_urlprint(title, image_url)res_image_req = requests.get(image_url).contentwith open(path+title + ".jpg", "wb") as f:f.write(res_image_req)print(f"第{page_ + 1}页下载完成!")time.sleep(1)
程序运行截图(是你的冰冰吗?
python爬取某网站图片相关推荐
- python爬虫真假网址,python爬取福利网站图片完整代码,懂得人都懂
网址需要自己替换懂的人都懂512*2,主要学习简单的爬虫,别乱用,否则后果自负! [Python] 纯文本查看 复制代码 import requests,bs4,re,os,threadingclas ...
- python爬取pexels网站图片
#coding:utf-8from lxml import etree import requests import urllib.request import progressbar header= ...
- python最新官网图片_python爬取福利网站图片完整代码
存起来 自己学习... import requests,bs4,re,os,threading class MeiNvTu: def __init__(self): self.url_main='ht ...
- python爬取动态网页图片
爬取某知名网站图片(爬取动态网页) python爬取动态网页图片 python爬取动态网页图片 环境: python3.pycharm 库: requests.urllib.json 思路: 1.分析 ...
- Python爬取小姐姐图片
使用Python爬取小姐姐图片 首先上网站链接 唯美女生 爬取图片主要分为一下几步: 1.打开一个你喜欢的小姐姐的网站 E.g xiaojiejie web 2.下载并安装python环境 pytho ...
- python爬取指定关键字图片
''' 爬取指定关键字图片 ''' import re# 正则表达式,解析网页 import requests# 请求网页 import traceback import osdef dowmload ...
- python爬取贴吧图片_Python爬取贴吧多页图片
Python爬取贴吧图片都只能爬取第一页的,加了循环也不行,现在可以了. #coding:utf-8 import urllib import urllib2 import re import os ...
- Python爬取自然风景图片代码
Python爬取自然风景图片代码 \qquad 需要用到python的etree库和requests库,需要提前下载安装. from lxml import etree import requests ...
- Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘
更多详情请查看Honker Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘 给大家推荐一款超好用的壁纸下载网站-- wallhaven 第一次知道这个网站的时候,惊为天 ...
最新文章
- 澎思科技与新加坡国立大学等高校共研AI产品加快技术应用落地
- 为什么 Linux 和 macOS 不需要碎片整理
- php $globa作用是l,php 关键字global在定义变量中的作用
- Scrum立会报告+燃尽图(十一月十八日总第二十六次):功能开发与讨论贡献分配规则...
- Python基础教程:判断列表重复
- 越过0到1的坎,卖好车开启1到10的路有难题?
- windows server2008服务器文件上传受限制怎么办,windows server 2008 服务器上传限制
- Java基础知识强化51:经典排序之桶排序(BucketSort)
- Entity Framework 并发处理
- 【数据结构笔记05】堆栈及其顺序存储、链式存储
- 干货 :如何系统地学习数据挖掘
- ora 01033 解决
- vscode win10笔记本 蓝屏_老鸟教你win10开机蓝屏0xc000000d的详尽解决办法
- android打开sd卡文件,从Android中的SD卡读取特定文件
- 智慧树期末考试可以切换页面吗_智慧树考试可以切换界面吗?中途可以退出吗...
- 轮廓图(Silhouette)
- C#创建和部署Windows Service程序
- 《Java程序设计》第三周学习总结
- 创业者在创业之初都需要做哪些准备工作呢
- git分支(存在意义和使用方法)
热门文章
网址需要自己替换懂的人都懂512*2,主要学习简单的爬虫,别乱用,否则后果自负! [Python] 纯文本查看 复制代码 import requests,bs4,re,os,threadingclas ...
#coding:utf-8from lxml import etree import requests import urllib.request import progressbar header= ...
存起来 自己学习... import requests,bs4,re,os,threading class MeiNvTu: def __init__(self): self.url_main='ht ...
爬取某知名网站图片(爬取动态网页) python爬取动态网页图片 python爬取动态网页图片 环境: python3.pycharm 库: requests.urllib.json 思路: 1.分析 ...
使用Python爬取小姐姐图片 首先上网站链接 唯美女生 爬取图片主要分为一下几步: 1.打开一个你喜欢的小姐姐的网站 E.g xiaojiejie web 2.下载并安装python环境 pytho ...
''' 爬取指定关键字图片 ''' import re# 正则表达式,解析网页 import requests# 请求网页 import traceback import osdef dowmload ...
Python爬取贴吧图片都只能爬取第一页的,加了循环也不行,现在可以了. #coding:utf-8 import urllib import urllib2 import re import os ...
Python爬取自然风景图片代码 \qquad 需要用到python的etree库和requests库,需要提前下载安装. from lxml import etree import requests ...
更多详情请查看Honker Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘 给大家推荐一款超好用的壁纸下载网站-- wallhaven 第一次知道这个网站的时候,惊为天 ...