爬美女图的的脚本分享, 灯灯灯噔....
大批量下美女图的, enjoy yourself....
#encoding=utf-8
import os
import time
import requests
from urllib.parse import urljoin
from bs4 import BeautifulSoupgid = [21036, 27886, 28030, 22204]heads = {"Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3",
"Accept-Encoding":"gzip, deflate, br",
"Accept-Language":"zh-CN,zh;q=0.9",
"Cache-Control":"no-cache",
"Connection":"keep-alive",
"Cookie":"__guid=186729645.3689942829764010500.1604539727900.4944; monitor_count=42",
#"Host":"t1.onvshen.com:85",
"Pragma":"no-cache",
"Referer":"https://m.nvshens.org/galleryimg.aspx?img=https://t1.onvshen.com:85/gallery/22204/34185/0.jpg",
"Sec-Fetch-Mode":"navigate",
"Sec-Fetch-Site":"none",
"Sec-Fetch-User":"?1",
"Upgrade-Insecure-Requests":"1",
"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36"}def saveImg(dir, fn, url):session = requests.Session()session.max_redirects = 3r = session.get(url, headers = heads, allow_redirects=False)#fn = time.strftime("%Y-%m-%d %H:%M:%S")#fn = url[-11:].replace("/","_")f = open(dir + "/" + fn,"wb")f.write(r.content)r.close()def visPage(url):r = requests.get(url, headers = heads)r.encoding = 'utf-8'return r.text '''
r = requests.get("https://m.nvshens.org/girl/22204/album/#")
r.encoding = 'utf-8'
soup = BeautifulSoup(r.content,"lxml")
imgs = soup.select(".hezi img")for img in imgs:print(img['src'])#saveImg(img['src'])
'''#解析 相册列表 页
url = "https://m.nvshens.org/girl/22204/album/#";html1 = visPage(url)
soup1 = BeautifulSoup(html1,"lxml")
pks = {}
lis = soup1.select(".ck-item a.ck-link")
#print("相册列表 文 " + html1)
for li in lis:alnk = li['href']#解析 套图 页html11 = visPage( urljoin(url, alnk) )soup11 = BeautifulSoup(html11,"lxml")ddinfo = soup11.select("#ddinfo span")[0].get_text()max_count = int(ddinfo[:-3])print("当前 套图 URL %s, 有 %d 张照片..."%(alnk, max_count) )pks[alnk[3:-1]] = max_countfail_pk_ones = []
rdir = "meitu/"
for pk in pks:lnks = pks[pk]if not os.path.exists(rdir):os.makedirs(rdir)pi = 0while pi < lnks:furl = "https://t1.onvshen.com:85/gallery/%s/%s/%s.jpg"%("22204", pk , str(pi).zfill(3))print("save img - " + furl)try:saveImg(rdir, "%s_%s.jpg"%(pk, str(pi).zfill(3)), furl)except Exception as e:print(e)fail_pk_ones.append( {pk:pi} )pi += 1print("fail ones ... "+ str(fail_pk_ones))
print("img download finish....")
#print(r.text)
爬美女图的的脚本分享, 灯灯灯噔....相关推荐
- 抓包都不会 你还想爬美女图??
怎么更快的抓包获取这些请求?作为爬虫的前戏工作:调试和抓包,是很重要的.今天我就详细的给大家分享一下浏览器 F12 开发者调试工具和 APP 抓包的常见用法. 网页抓包 首先对于网页爬虫来说怎么抓包呢 ...
- 运用Python爬虫爬取一个美女网址,爬取美女图
运用Python爬虫爬取一个美女网址,爬取美女图 要运用到的python技术: 导入库 1.request 发送请求,从服务器获取数据 2.BeautifulSoup 用来解析整个网页的源代码 imp ...
- 用python爬小说_今天分享一个用Python来爬取小说的小脚本!(附源码)
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章天气预报数据分析与统计之美 ,作者:❦大头雪糕❦ Python GUI制作小说下载器教学讲 ...
- python爬取天气预报数据并保存为txt格式_今天分享一个用Python来爬取小说的小脚本!(附源码)...
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章天气预报数据分析与统计之美 ,作者:❦大头雪糕❦ Python GUI制作小说下载器教学讲 ...
- 十一、练习:爬取图虫网付费图片
十.练习:爬取图虫网免费图片 今天爬下图虫网付费的图片,比之前的免费图片简单. 这里的付费图片都是一个专辑的 这个我在一个公开课听的,说这个是:https://tuchong.com/rest/tag ...
- 在 Windows 系统下常用的 bat 脚本分享
以网络配置举例说明,网络连接默认情况下都是 DHCP(自动获取 IP 和 DNS 地址) 模式,但很多情况下,需要我们设置为指定的静态 IP 和 DNS 地址.在 Windows 系统中通常我们都是在 ...
- android 漫画加载方案,Android加载长图的多种方案分享
背景介绍 在某些特定场景下,我们需要考虑加载长图的需求,比如加载一幅<清明上河图>,这个好像有点过分了,那就加载1/2的<清明上河图>吧... 那TMD还不是一样道理. 言归正 ...
- Mysqldump备份说明及数据库备份脚本分享-运维笔记
MySQLdump是MySQL自带的导出数据工具,即mysql数据库中备份工具,用于将MySQL服务器中的数据库以标准的sql语言的方式导出,并保存到文件中.Mysqldump是一个客户端逻辑备份的工 ...
- flutter 切图重命名脚本
把2倍图,3倍图进行冲命名 import os, shutilwork_dir = '/Users/baohong/Downloads/未命名文件夹3/slices' shutil.rmtree(wo ...
最新文章
- Bootstrap表单验证插件bootstrapValidator使用方法整理
- 1.12 深层循环神经网络-深度学习第五课《序列模型》-Stanford吴恩达教授
- FE.ENV-manjaro虚拟机配置和常见前端工具安装
- 前端开发一些很有用的工具
- redis入门——安装篇
- [LeetCode] NO. 8 String to Integer (atoi)
- 百度宣布AI同传最新突破!能预测,低延时,演示效果惊人,外媒称媲美人类翻译...
- CSS opacity - 实现图片半透明效果
- C语言-输入任意多个数字,数字间用空格隔开,然后将数字求和。
- 谷歌浏览器http请求之curl使用
- Mysql系统参数查询和设置
- c语言写股票交易软件,写股票软件
- 如何提高(怎样才能不断提升自己)
- 在SQL server 2008 R2进行数据查询操作时提示 “对象名无效”的问题
- 第六节NoSQL+时序数据库+RabbitMQ安装
- 大数据单表查询mysql
- 阿里生鲜布局重要抓手!它如何解决全球生鲜商家痛点?
- 风影ASP.NET基础教学16 母版页
- rhel6 下iib9.0实现HA
- chrome浏览器如何避免network报错:ERR_CERT_AUTHORITY_INVALID并添加为例外或继续前往