python爬虫爬图片

爬虫爬校花网校花的图片

第一步

载入爬虫模块#载入爬虫模块

import re #载入爬虫模块

import requests #载入爬虫模块

第二步

获得校花网的地址,获得其网页F12内的所有东西#获得校花网的地址,获得其网页F12内的所有东西

import re #载入爬虫模块

import requests #载入爬虫模块

response = requests.get(f'http://www.xiaohuar.com/list-1-0.html')

data = response.text #data就是我们要的校花F12里的东西啦,并用字符串格式保存

第三步

获得校花网的地址,图片的链接#获得校花网的地址,图片的链接

import re #载入爬虫模块

import requests #载入爬虫模块

response = requests.get(f'http://www.xiaohuar.com/list-1-0.html')

data = response.text #data就是我们要的校花F12里的东西啦,并用字符串格式保存

one_list = re.findall('" src="(.*?)" />',data) #其中(.*?)表示我们所要获得的内容

for v in range(len(one_list)): #type:str 这是为了让PYCHARM更快的知道V是字符串格式方便导入内置方法

if one_list[v].startswith('/d'): #这是为了让其中有些保护的图片变成正确的超链接格式

one_list[v] = f'http://www.xiaohuar.com/{one_list[v]}'

第四步

创建文件保存下来#获得校花网的地址,图片的链接

import re #载入爬虫模块

import requests #载入爬虫模块

response = requests.get(f'http://www.xiaohuar.com/list-1-0.html')

data = response.text #data就是我们要的校花F12里的东西啦,并用字符串格式保存

one_list = re.findall('" src="(.*?)" />',data) #其中(.*?)表示我们所要获得的内容

for v in range(len(one_list)): #type:str 这是为了让PYCHARM更快的知道V是字符串格式方便导入内置方法

if one_list[v].startswith('/d'): #这是为了让其中有些保护的图片变成正确的超链接格式

one_list[v] = f'http://www.xiaohuar.com/{one_list[v]}'

for x in one_list: #type:str

name = x.split('/')[-1] #为了自动生成文件名

dd = requests.get(x) #获得图片的信息

dd = dd.content #图片信息装换成机械语言

with open(f'D:\图片\{name}','wb') as fw: #创建文件的路径 , 写入保存

fw.write(dd)

fw.flush()

第五步

获得校花网下一页中的所有能让并且每获取一张打印一次import re #模块

import requests #模块

num = 0 #为了记录爬的照片的次数

for url_name in range(44):

response = requests.get(f'http://www.xiaohuar.com/list-1-{url_name}.html')

data = response.text

# print(data)

one_list = re.findall('" src="(.*?)" />',data)

for v in range(len(one_list)): #type:str

if one_list[v].startswith('/d'):

one_list[v] = f'http://www.xiaohuar.com/{one_list[v]}'

for x in one_list: #type:str

name = x.split('/')[-1]

dd = requests.get(x)

dd = dd.content

with open(f'D:\图片\{name}','wb') as fw:

fw.write(dd)

fw.flush()

num += 1

print(f'爬取{num}张')

python爬图片_python爬虫(爬取图片)相关推荐

  1. python爬虫网页中的图片_Python爬虫爬取一个网页上的图片地址实例代码

    本文实例主要是实现爬取一个网页上的图片地址,具体如下. 读取一个网页的源代码: import urllib.request def getHtml(url): html=urllib.request. ...

  2. python网络爬图_Python爬虫爬图片需要什么

    Python爬虫爬图片需要什么?下面用两种方法制作批量爬取网络图片的方法: 第一种方法:基于urllib实现 要点如下: 1.url_request = request.Request(url) 2. ...

  3. python爬虫微博评论图片_python爬虫爬取微博评论

    原标题:python爬虫爬取微博评论 python爬虫是程序员们一定会掌握的知识,练习python爬虫时,很多人会选择爬取微博练手.python爬虫微博根据微博存在于不同媒介上,所爬取的难度有差异,无 ...

  4. python宣传图片_Python爬虫,高清美图我全都要!爬取你想要的,嘿嘿嘿

    select = 'div#main div.list ul li a' imgUrls = screen(url, select) 通过这两行代码获取的列表中的值,形如此:星空 女孩 观望 唯美夜景 ...

  5. python爬图片_Python爬虫:彼岸图网图片爬取-Go语言中文社区

    杂 哈哈,这是我第一篇博客 半年以后回来再看发现这代码简直太难看了 现在已经弃用大小驼峰转蛇形命名了 确实好看 除了命名别的也写的不怎么样 因为爬虫只是个爱好所以也不准备再投入时间重构了 将就着看吧 ...

  6. python爬虫爬汽车图片_python爬虫爬取汽车网站外型图片

    我选择的起始网址:http://www.hao123.com/auto/brand 当你随便选择一个车牌的选框( 不要 同时选择多个选框)你就会发现每个车牌对应一个网址 每个网址的区别就是数字不同 比 ...

  7. python xpath循环_Python爬虫 爬取北京二手房数据

    点击蓝字"python教程"关注我们哟! 前言 Python现在非常火,语法简单而且功能强大,很多同学都想学Python!所以小的给各位看官们准备了高价值Python学习视频教程及 ...

  8. python输出古诗词_python爬虫——爬取古诗词

    一. 概要 1.通过python爬虫循环爬取古诗词网站唐诗宋词 2.落地到本地数据库 二. 页面分析 首先通过firedebug进行页面定位: 其次源码定位: 最终生成lxml etree定位div标 ...

  9. python输出古诗词_python爬虫——爬取古诗名句

    一. 概要 1.通过python爬虫循环爬取古诗词网站古诗名句 2.落地到本地数据库 二. 页面分析 首先通过firedebug进行页面定位: 其次源码定位: 最终生成lxml etree定位div标 ...

最新文章

  1. LeetCode: 103. Binary Tree Zigzag Level Order Traversal
  2. PHP的抽象类的一段简单代码示例
  3. WinRAR 5.70 下载、安装和广告弹框去除
  4. C# 进程之间的通讯
  5. 新华字典java_新华字典查询示例代码
  6. Zookeeper:基于Zookeeper的分布式锁与领导选举
  7. Keil综合(02)工程窗口各项图标描述
  8. w3school---JQuery HTML
  9. 【Python】106页的《python进阶》,附下载
  10. HTML5表单技术 调查问卷设计
  11. mac插网线不能上网_我的Macbook插上网线为什么不能上网? – 手机爱问
  12. java 实现linux进度条,Linux实现的进度条一(基本知识学习和简单功能)
  13. numpy的stack大白话解释
  14. RUNA WFE,workflow environment based on JBoss' JBPM engine
  15. 张宏 :移动机器人全局定位技术与方法是啥?道翰天琼认知智能机器人平台API接口大脑为您揭秘。
  16. java中outer:的用法
  17. 简述存储器的分级策略
  18. 凸优化基础知识笔记-凸集、凸函数、凸优化问题
  19. c++程序设计报告总结
  20. 程序员课外拓展013:桌面云涉及到的概念

热门文章

  1. c语言k11 k1是指什么意思,成都新开K15公交线 同步调整K11线和K13线
  2. disconf java_Spring MVC 集成Disconf
  3. BlackBerry模拟器中文支持
  4. 【gec6818学习】
  5. 第七章--触摸屏移植
  6. 活体检测算法 python_基于Python、Keras和OpenCV的实时人脸活体检测
  7. uni-app 获取input的值
  8. Recast Navigation 学习笔记(一)
  9. web前端逃坑指南------H5及微信中JavaScript唤起app的解决方案callapp-lib
  10. 为什么越来越多的实体商企开始使用VR全景?如何在激烈竞争中占得一席之地呢?