import urllib.request
import re

隐藏自己的包头信息

def get_html(url):request = urllib.request.Request(url) #添加地址request.add_header("user-agent","Mozilla/4.0 (Windows NT 6.5.0;\Win32; x86; rv:69.0) Gecko/20100101 Firefox/69.0") #添加头部信息response = urllib.request.urlopen(request) #提交信息包含头部信息html = str(response.read(),encoding="utf8") #获取页面后转换为字符串return html

获取图片网址

def get_imglist(html):newimglist = []imglist = re.findall("style/\w{60}\.jpg",html)#根据正则表达式,获取图片信息for i in imglist:newimglist.append("http://192.168.139.135/"+i) #这个是本地做的网页,写的自己的IP地址+信息                                                                        return newimglist

根据图片网站下载图片到本地

def get_img(imglist):num = 0for i in imglist: #每一个图的地址request = urllib.request.Request(i) #添加地址request.add_header("user-agent","Mozilla/4.0 (Windows NT 6.5.0;\Win32; x86; rv:69.0) Gecko/20100101 Firefox/69.0") #添加头部信息response = urllib.request.urlopen(request) #提交信息包含头部信息html = response.read() #获取图片的二进制内容num += 1 #为了文件名称定义with open(r"C:\Users\changpin\Desktop\a\%s.jpg" %num,"wb") as f: #图片用二进制图片写入路径是我自己写的f.write(html)

主函数的调用

if __name__ == "__main__":url = "http://192.168.139.135"html = get_html(url)#print(html)输出网页代码的所有信息imglist = get_imglist(html)#print(imglist)获取图片信息get_img(imglist)

python爬虫获取图片相关推荐

  1. python爬虫获取图片无法打开或已损坏_Python爬取小姐姐图片

    爬取图片主要分为一下几步: 1.打开一个你喜欢的小姐姐的网站 2.下载并安装python环境 3.开始编码 python 全部代码如下 # requests 请求 需要提前在Terminal中安装 p ...

  2. python爬虫获取图片无法打开或已损坏_Python爬虫,图片下载完后是损坏的,怎么解决?...

    coding:utf-8 import requests from bs4 import BeautifulSoup import os import sys reload(sys) sys.setd ...

  3. python下载图片并保存_Python爬虫获取图片并下载保存至本地的实例

    1.抓取煎蛋网上的图片. 2.代码如下: import urllib.request import os #to open the url def url_open(url): req=urllib. ...

  4. Python爬虫获取异步加载站点pexels并下载图片(Python爬虫实战3)

    Python爬虫获取异步加载站点pexels并下载图片(Python爬虫实战3) 1. 异步加载爬虫 对于静态页面爬虫很容易获取到站点的数据内容,然而静态页面需要全量加载站点的所有数据,对于网站的访问 ...

  5. Python爬虫 | Python爬虫获取女友图片

    Python爬虫 | Python爬虫获取女友图片 前言 程序说明 二次元女友获取程序 观察网页结构 页面解析 创建图片保存路径 图片下载 格式转换 爬取结果展示 完整程序 前言 (又到了常见的无中生 ...

  6. Python爬虫获取简书的用户、文章、评论、图片等数据,并存入数据库

    Python爬虫获取简书的用户.文章.评论.图片等数据,并存入数据库 爬虫定义:网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维 ...

  7. python爬虫获取url_Python爬虫如何获取页面内所有URL链接?本文详解

    如何获取一个页面内所有URL链接?在Python中可以使用urllib对网页进行爬取,然后利用Beautiful Soup对爬取的页面进行解析,提取出所有的URL. 什么是Beautiful Soup ...

  8. 突破次元壁障,Python爬虫获取二次元女友

    突破次元壁障,Python爬虫获取二次元女友 前言 程序说明 二次元女友获取程序 观察网页结构 页面解析 创建图片保存路径 图片下载 格式转换 爬取结果展示 完整程序 前言 (又到了常见的无中生友环节 ...

  9. python爬虫获取天猫店铺信息(更新到2020年)

    python爬虫获取天猫店铺信息 爬取需求 在天猫搜索一个关键词,然后抓取这个关键词下的相关店铺,由于taobao的反爬策略,只能爬取到第十页大概200个店铺的信息. 效果预览 最终爬取的数据用exc ...

最新文章

  1. 基于CentOS中PXE网络环境构建实例
  2. Win7下安装一个装逼文本编辑器Atom + activate-power-mode插件
  3. 全国ps职称计算机试题及答案,最新职称计算机考试photoshop练习题
  4. python 命令-Python中执行系统命令的四种方法
  5. mysql删除重复记录
  6. EOS资源模型(1)资源说明
  7. xshell执行结果到文本_xshell拷贝文件到本地
  8. apache.camel_Apache Camel 2.21发布–新增功能
  9. 读书笔记——信息的表示与处理
  10. mysql 命令 utf8_Mysql 统一设置utf8字符
  11. 3Ddungeon-------三维搜索-----偷个懒 把 亡命逃窜 的代码修改了一下 拿来用了
  12. linux命令大全之ss命令详解(获取socket统计信息)
  13. Linux ERROR: configuration failed for package ‘rgeos’
  14. SimpleDateFormat 使用TimeZone
  15. Android——TextView指定字符串颜色高亮,实现类似微信、支付宝搜索结果中搜索字段高亮的效果
  16. 深度学习培训完可以找工作吗?深度学习可以做什么?
  17. 如何在电脑上下载python中文版_Python下载-Python中文版官方下载
  18. Qml自定义等待指示器
  19. 从RMSE和MSE到更多选择:探索机器学习模型性能指标
  20. python 实现zigzag排列

热门文章

  1. 【Java数据结构及算法实战】系列002:算法的四种描述方式
  2. Python 数据分析师前景及待遇
  3. Windows Charles iPhone抓包Https请求配置流程
  4. win10写c语言 知乎,如何优雅的使用win10 知乎
  5. Linux XFS文件系统
  6. opengl/c++ 用粒子系统实现星轨效果
  7. 嵌入式ARM64 uboot 2022.01 移植
  8. NSA Fuzzbunch中EternalRomance工具复现过程
  9. mac os netcat -lp 不能使用情况解决
  10. 【大数据实战】Docker中Hadoop集群搭建