import urllib.request
import re

隐藏自己的包头信息

def get_html(url):request = urllib.request.Request(url) #添加地址request.add_header("user-agent","Mozilla/4.0 (Windows NT 6.5.0;\Win32; x86; rv:69.0) Gecko/20100101 Firefox/69.0") #添加头部信息response = urllib.request.urlopen(request) #提交信息包含头部信息html = str(response.read(),encoding="utf8") #获取页面后转换为字符串return html

获取图片网址

def get_imglist(html):newimglist = []imglist = re.findall("style/\w{60}\.jpg",html)#根据正则表达式，获取图片信息for i in imglist:newimglist.append("http://192.168.139.135/"+i) #这个是本地做的网页，写的自己的IP地址+信息                                                                        return newimglist

根据图片网站下载图片到本地

def get_img(imglist):num = 0for i in imglist: #每一个图的地址request = urllib.request.Request(i) #添加地址request.add_header("user-agent","Mozilla/4.0 (Windows NT 6.5.0;\Win32; x86; rv:69.0) Gecko/20100101 Firefox/69.0") #添加头部信息response = urllib.request.urlopen(request) #提交信息包含头部信息html = response.read() #获取图片的二进制内容num += 1 #为了文件名称定义with open(r"C:\Users\changpin\Desktop\a\%s.jpg" %num,"wb") as f: #图片用二进制图片写入路径是我自己写的f.write(html)

主函数的调用

if __name__ == "__main__":url = "http://192.168.139.135"html = get_html(url)#print(html)输出网页代码的所有信息imglist = get_imglist(html)#print(imglist)获取图片信息get_img(imglist)

python爬虫获取图片相关推荐

python爬虫获取图片无法打开或已损坏_Python爬取小姐姐图片
爬取图片主要分为一下几步: 1.打开一个你喜欢的小姐姐的网站 2.下载并安装python环境 3.开始编码 python 全部代码如下 # requests 请求需要提前在Terminal中安装 p ...
python爬虫获取图片无法打开或已损坏_Python爬虫，图片下载完后是损坏的，怎么解决？...
coding:utf-8 import requests from bs4 import BeautifulSoup import os import sys reload(sys) sys.setd ...
python下载图片并保存_Python爬虫获取图片并下载保存至本地的实例
1.抓取煎蛋网上的图片. 2.代码如下: import urllib.request import os #to open the url def url_open(url): req=urllib. ...
Python爬虫获取异步加载站点pexels并下载图片(Python爬虫实战3)
Python爬虫获取异步加载站点pexels并下载图片(Python爬虫实战3) 1. 异步加载爬虫对于静态页面爬虫很容易获取到站点的数据内容,然而静态页面需要全量加载站点的所有数据,对于网站的访问 ...
Python爬虫 | Python爬虫获取女友图片
Python爬虫 | Python爬虫获取女友图片前言程序说明二次元女友获取程序观察网页结构页面解析创建图片保存路径图片下载格式转换爬取结果展示完整程序前言 (又到了常见的无中生 ...
Python爬虫获取简书的用户、文章、评论、图片等数据，并存入数据库
Python爬虫获取简书的用户.文章.评论.图片等数据,并存入数据库爬虫定义:网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维 ...
python爬虫获取url_Python爬虫如何获取页面内所有URL链接？本文详解
如何获取一个页面内所有URL链接?在Python中可以使用urllib对网页进行爬取,然后利用Beautiful Soup对爬取的页面进行解析,提取出所有的URL. 什么是Beautiful Soup ...
突破次元壁障，Python爬虫获取二次元女友
突破次元壁障,Python爬虫获取二次元女友前言程序说明二次元女友获取程序观察网页结构页面解析创建图片保存路径图片下载格式转换爬取结果展示完整程序前言 (又到了常见的无中生友环节 ...
python爬虫获取天猫店铺信息（更新到2020年）
python爬虫获取天猫店铺信息爬取需求在天猫搜索一个关键词,然后抓取这个关键词下的相关店铺,由于taobao的反爬策略,只能爬取到第十页大概200个店铺的信息. 效果预览最终爬取的数据用exc ...

python爬虫获取图片

隐藏自己的包头信息

获取图片网址

根据图片网站下载图片到本地

主函数的调用

python爬虫获取图片相关推荐

最新文章

热门文章