第一个爬虫项目-爬取唯美小姐姐网站

爬取唯美小姐姐网站

链接: 源代码文件下载地址
展示 源代码

import requests
import re
import os
import time# 伪装 用于可以伪装成浏览器。
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36'
}# 请求网页
# 爬取妹子图网站 https://www.tupianzj.com/meinv/mm/meizitu/
print("网页请求中...")
time.sleep(0.5)
response = requests.get("https://www.tupianzj.com/meinv/mm/meizitu/", headers=headers)
html = response.text # 获取html信息
# print(html)
print("网页信息已获取...")
time.sleep(0.5)# 网页部分内容展示示例
# <LI><a href="/meinv/20200728/214746.html" target="_blank"><img src="https://img.tupianzj.com/uploads/allimg/202007/9999/rn815784ca39.jpg" alt="Í²ÍàÃÀÅ®Ð¦ØÌÈç»¨Æ¯ÁÁÃÃ×ÓÍ¼" border="0" /></a>print("网页信息解析中...")
# 解析网页
urls = re.findall(r'<img src="[a-zA-Z]+://[^\s]*[.jpg]',html) # 使用正则表达式匹配图片的URL
# print(urls[0])
# <img src="https://img.tupianzj.com/uploads/allimg/202009/9999/rn984c2cbc21.jpgtime.sleep(0.5)
print("建立下载目录...")
# 建立下载目录
dir_name = "download"
if not os.path.exists(dir_name):os.mkdir(dir_name)time.sleep(0.5)
print("下载目录：/",dir_name,'建立完成...')# url = "https://img.tupianzj.com/uploads/allimg/202007/9999/rn815784ca39.jpg"
# print(url.split('/'))
# print(url.split('/')[-1]) # 获取图片名time.sleep(0.5)print("网页图片请求中...")
# 下载图片
for url in urls:# 相隔1s# time.sleep(0.01)# 图片的名字file_name = url.split('/')[-1] # 以'/'来分割字符串response = requests.get(url[10:], headers=headers) # url[10:]的作用是出去前缀<img src="# 保存with open(dir_name + "/" + file_name, 'wb') as f:f.write(response.content)  # 将图片写入到文件夹下保存info = "图片文件：    {0:25}{1}".format(file_name," 成功下载...")# print("图片文件： ",file_name," 成功下载...")print(info)time.sleep(0.5)
print("图片爬取完成...")
print("当前时间： ",time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))

效果展示1：

效果展示2：

效果展示3：

第一个爬虫项目-爬取唯美小姐姐网站相关推荐

爬虫实战--爬取1000位小姐姐照片，刷新你三观颜值！
爬取的网站链接:http://www.mmonly.cc/mmtp/ 主页网址唯一图库直接点到末页,一共有1274页. 右键点击一个图片链接,选择审查元素这里的img是就封面,如果只抓取封面的话,到 ...
python爬虫之爬取“唯美“主流图片
个人名片:
爬取唯美女生网站上所有小姐姐的照片
爬取唯美女生网站前几天刚好看到有人在教学爬取唯美女生网站(https://www.vmgirls.com)的图片,大致听了一下,只是介绍了一次爬取某一个小姐姐的照片,因此就尝试做一个爬取全站小姐姐照 ...
Ajax爬取唯美女孩图片
requests爬取唯美女孩图片一.前言二.实现项目 1.分析网页 2.爬取网页 2-1.模拟POST请求 2-2.解析图集列表页面 2-2.解析图集页面 2-3.保存图片 2-4.执行爬虫 3. ...
Python爬虫项目--爬取某宝男装信息
本次爬取用到的知识点有: 1. selenium 2. pymysql 3 pyquery ''' 文章:Python爬虫项目--爬取某宝男装信息作者:Star_Zhao 源自:https://w ...
python爬虫金融数据_python爬虫项目-爬取雪球网金融数据（关注、持续更新）
(一)python金融数据爬虫项目爬取目标:雪球网(起始url:https://xueqiu.com/hq#exchange=cn&firstname=1&secondname=1_ ...
python使用 Scrapy 爬取唯美女生网站的图片资源
python python使用 Scrapy 爬取唯美女生网站的资源,图片很好,爬取也有一定的难度,最终使用Scrapy获取了该网站 1.5W多张美眉照片....如有侵权,联系,立删除. ==== ...
Python爬取 | 唯美女生图片
这里只是代码展示,且复制后不能直接运行,需要配置一些设置才行,具体请查看下方链接介绍: Python爬取 | 唯美女生图片 from selenium import webdriver from fa ...
Python爬虫 | 爬取高质量小姐姐照片
Python爬虫 | 爬取高质量小姐姐照片 1.数据来源分析 2.获取author_id_list和img_id 3.制作detial 4.制作detial_list 5.数据保存 6.批量获取 7. ...

第一个爬虫项目-爬取唯美小姐姐网站

第一个爬虫项目-爬取唯美小姐姐网站相关推荐

最新文章

热门文章