爬取唯美小姐姐网站

链接: 源代码文件下载地址
展示 源代码

import requests
import re
import os
import time# 伪装 用于可以伪装成浏览器。
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36'
}# 请求网页
# 爬取妹子图网站 https://www.tupianzj.com/meinv/mm/meizitu/
print("网页请求中...")
time.sleep(0.5)
response = requests.get("https://www.tupianzj.com/meinv/mm/meizitu/", headers=headers)
html = response.text # 获取html信息
# print(html)
print("网页信息已获取...")
time.sleep(0.5)# 网页部分内容展示示例
# <LI><a href="/meinv/20200728/214746.html" target="_blank"><img src="https://img.tupianzj.com/uploads/allimg/202007/9999/rn815784ca39.jpg" alt="ͲÍàÃÀŮЦØÌÈ绨ƯÁÁÃÃ×Óͼ" border="0" /></a>print("网页信息解析中...")
# 解析网页
urls = re.findall(r'<img src="[a-zA-Z]+://[^\s]*[.jpg]',html) # 使用正则表达式匹配图片的URL
# print(urls[0])
# <img src="https://img.tupianzj.com/uploads/allimg/202009/9999/rn984c2cbc21.jpgtime.sleep(0.5)
print("建立下载目录...")
# 建立下载目录
dir_name = "download"
if not os.path.exists(dir_name):os.mkdir(dir_name)time.sleep(0.5)
print("下载目录:/",dir_name,'建立完成...')# url = "https://img.tupianzj.com/uploads/allimg/202007/9999/rn815784ca39.jpg"
# print(url.split('/'))
# print(url.split('/')[-1]) # 获取图片名time.sleep(0.5)print("网页图片请求中...")
# 下载图片
for url in urls:# 相隔1s# time.sleep(0.01)# 图片的名字file_name = url.split('/')[-1] # 以'/'来分割字符串response = requests.get(url[10:], headers=headers) # url[10:]的作用是出去前缀<img src="# 保存with open(dir_name + "/" + file_name, 'wb') as f:f.write(response.content)  # 将图片写入到文件夹下保存info = "图片文件:    {0:25}{1}".format(file_name," 成功下载...")# print("图片文件: ",file_name," 成功下载...")print(info)time.sleep(0.5)
print("图片爬取完成...")
print("当前时间: ",time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))

效果展示1:

效果展示2:

效果展示3:

第一个爬虫项目-爬取唯美小姐姐网站相关推荐

  1. 爬虫实战--爬取1000位小姐姐照片,刷新你三观颜值!

    爬取的网站链接:http://www.mmonly.cc/mmtp/ 主页网址唯一图库直接点到末页,一共有1274页. 右键点击一个图片链接,选择审查元素 这里的img是就封面,如果只抓取封面的话,到 ...

  2. python爬虫之爬取“唯美“主流图片

    个人名片:

  3. 爬取唯美女生网站上所有小姐姐的照片

    爬取唯美女生网站 前几天刚好看到有人在教学爬取唯美女生网站(https://www.vmgirls.com)的图片,大致听了一下,只是介绍了一次爬取某一个小姐姐的照片,因此就尝试做一个爬取全站小姐姐照 ...

  4. Ajax爬取唯美女孩图片

    requests爬取唯美女孩图片 一.前言 二.实现项目 1.分析网页 2.爬取网页 2-1.模拟POST请求 2-2.解析图集列表页面 2-2.解析图集页面 2-3.保存图片 2-4.执行爬虫 3. ...

  5. Python爬虫项目--爬取某宝男装信息

    本次爬取用到的知识点有: 1. selenium 2. pymysql 3  pyquery ''' 文章:Python爬虫项目--爬取某宝男装信息 作者:Star_Zhao 源自:https://w ...

  6. python爬虫金融数据_python爬虫项目-爬取雪球网金融数据(关注、持续更新)

    (一)python金融数据爬虫项目 爬取目标:雪球网(起始url:https://xueqiu.com/hq#exchange=cn&firstname=1&secondname=1_ ...

  7. python使用 Scrapy 爬取唯美女生网站的图片资源

    python  python使用 Scrapy 爬取唯美女生网站 的资源,图片很好,爬取也有一定的难度,最终使用Scrapy获取了该网站 1.5W多张美眉照片....如有侵权,联系,立删除. ==== ...

  8. Python爬取 | 唯美女生图片

    这里只是代码展示,且复制后不能直接运行,需要配置一些设置才行,具体请查看下方链接介绍: Python爬取 | 唯美女生图片 from selenium import webdriver from fa ...

  9. Python爬虫 | 爬取高质量小姐姐照片

    Python爬虫 | 爬取高质量小姐姐照片 1.数据来源分析 2.获取author_id_list和img_id 3.制作detial 4.制作detial_list 5.数据保存 6.批量获取 7. ...

最新文章

  1. 开机不进去桌面执行gui_电脑系统崩溃进不去,简单几步设置U盘,快速找回桌面重要文件...
  2. 列选主元guass消去法
  3. java 底层方法_底层方法测试--【Java】
  4. IP头中的校验和计算方法介绍
  5. 设计模式[20]-Builder
  6. 哈夫曼编码压缩率计算_程序员的算法课(8)-贪心算法:理解霍夫曼编码
  7. 复平面中的点集预备知识
  8. 数据库SQL基础知识点
  9. 通过border来实现各种三角符号
  10. vue-cli配置jquery 以及jquery第三方插件
  11. 机器学习--支持向量机(四)SMO算法详解
  12. 数据挖掘导论思维导图
  13. 2013.05.09
  14. Linux运维从入门到进阶
  15. php获取网站备案信息
  16. dis的前缀单词有哪些_前缀dis-(dif-,di-) = apart;to undo;lack of,to remove;not
  17. AD domain 环境下VBS自动生成邮件签名
  18. Harbor2.2 用户角色权限速查
  19. pytest和allure生成测试报告
  20. 微软workflow foundation介绍

热门文章

  1. unity ECS简介
  2. java专业大学生入伍_JAVA程序征兵系统(包含登录系统和征兵系统)
  3. U-Net论文阅读(逐句翻译+精读)
  4. Golang实现文件搜索器
  5. 【pytorch yolov5 模型优化和超参数自动调整】
  6. 2020-8-15 无线充电原理和注意事项 WCP/铁氧体
  7. 被微信绑架下的生活 还能刷出存在感吗
  8. 从《我不是潘金莲》谈程序员的核心竞争力 1
  9. Android 2个Service实现相互保活,通过bindservice来实现,不通过广播实现
  10. (44.1)【APP应用漏洞发现】抓包工具、协议分析、逆向工程