python批量下载文件教程_Python抓包菜鸟教程:批量下载图片的方法,电脑和手机都能用...
笔者看上了一组图集,然后准备一张一张下载时,瞄了一眼,这组图集还有100+,好吧,我酸了。
笔者就是试试工具,你们别像我这样用,这么好的工具,做自媒体,那绝对了
那如何批量下载几百张图片呢?教程开始了。
首先,电脑准备下载一个Python(版本尽量3.0以上),Android系统下载一个pydroid3,iOS系统用Pythonista。
下面我就用电脑教程了,手机教程更简单,安装了requests库后,直接划到下面取代码运行。
把软件下载安装之后,我们首先要安装Python第三方库。
打开软件,在页面输入:import requests
如上图,就是没有安装第三方requests库,那我们就要安装一下。
按下键盘的Win+R打开运行窗口,输入cmd,打开DOS窗口。(可能有人看了看键盘,Win键位我咋找不到呢?哈哈哈,如果你还不会打开,那么你百度一下:如何打开DOS窗口,按照教程打开就可以了)。
在DOS窗口中输入:pip install requests
然后我们到Python中查看是否安装成功requests库:
没有像之前的红色警告,那么表明我们已成功安装requests库。
我们新建一个文件来写代码:
我们在新建的文件页面写程序:
import urllib.requestimport reimport osimport urllib#根据给定的网址来获取网页详细信息,得到的html就是网页的源代码def getHtml(url):page = urllib.request.urlopen(url)html = page.read()return html.decode('UTF-8')def getImg(html):reg = r'src="(.+?\.jpg)" pic_ext'imgre = re.compile(reg)imglist = imgre.findall(html)#表示在整个网页中过滤出所有图片的地址,放在imglist中x = 0path = 'E:\\test'# 将图片保存到E:\\test文件夹中,如果没有test文件夹则创建if not os.path.isdir(path):os.makedirs(path)paths = path+'\\' #保存在test路径下for imgurl in imglist:urllib.request.urlretrieve(imgurl,'{}{}.jpg'.format(paths,x)) #打开imglist中保存的图片网址,并下载图片保存在本地,format格式化字符串x = x + 1return imglisthtml = getHtml("http://tieba.baidu.com/p/2460150866")#获取该网址网页详细信息,得到的html就是网页的源代码print (getImg(html)) #从网页源代码中分析并下载保存图片
按下键盘F5键位,运行代码:就能抓到图片了。
python批量下载文件教程_Python抓包菜鸟教程:批量下载图片的方法,电脑和手机都能用...相关推荐
- python网页爬虫菜鸟教程_Python 爬取菜鸟教程(www.runoob.com)内容。并保在本地(html格式/pdf格式)...
最近在开始学Python 也想着做个爬虫玩玩 之前学习(php,jquery...)的时候,经常去菜鸟教程看.索性就将其教程爬下来(打印出来)翻阅起来更有感觉. 好了废话不多说先讲讲我的思路: 首先先 ...
- python自动化之文件处理_Python自动化办公之Word批量转成自定义格式的Excel
作者:青春阳光king python实现word转成自定义格式的excel文档(解决思路和代码)支持按照文件夹去批量处理,也可以单独一个文件进行处理,并且可以自定义标识符. 最近在开发一个答题类的小程 ...
- python数字求和菜鸟教程_Python Number(数字) | 菜鸟教程
Python Number(数字) Python Number 数据类型用于存储数值. 数据类型是不允许改变的,这就意味着如果改变 Number 数据类型的值,将重新分配内存空间. 以下实例在变量赋值 ...
- python怎么定义int变量_Python 变量类型 | 菜鸟教程
Python 变量类型 变量存储在内存中的值.这就意味着在创建变量时会在内存中开辟一个空间. 基于变量的数据类型,解释器会分配指定内存,并决定什么数据可以被存储在内存中. 因此,变量可以指定不同的数据 ...
- Charles 抓包工具教程(七) Charles- compose 创建模拟请求
本文为在霍格沃兹测试开发学社中学习到的一些技术,写出来分享给大家,希望有志同道合的小伙伴可以一起交流技术,一起进步~ Charles- compose 创建模拟请求 一.背景 二.Compose 一. ...
- 抓包工具:Fiddler下载、安装、使用 教程
文章目录 抓包工具:Fiddler下载.安装.使用 教程 一.Fiddler 下载 二.Fiddler 安装 三.Fiddler 使用 3.Statistics 请求的性能数据分析 4.Inspect ...
- python抓包代码_Python抓包并解析json爬虫的完整实例代码
Python抓包并解析json爬虫FwA免费资源网 在使用Python爬虫的时候,通过抓包url,打开url可能会遇见以下类似网址,打开后会出现类似这样的界面,无法继续进行爬虫:FwA免费资源网 Fw ...
- python 抓包解析数据_Python抓包并解析json爬虫的完整实例代码
Python抓包并解析json爬虫 在使用Python爬虫的时候,通过抓包url,打开url可能会遇见以下类似网址,打开后会出现类似这样的界面,无法继续进行爬虫: 例如: 需要爬取网页中第二页的数据时 ...
- APP渗透—Android 7.0 抓包(教程)
零基础学黑客,搜索公众号:白帽子左一 关于APP渗透的教程及思路,之前发过视频,视频地址:https://www.bilibili.com/video/BV1WK411w7UA/ 用到的工具 1.Pr ...
最新文章
- C#Winform+WindowsAPI做个剪贴板无缝自动保存器(视频截图利器)
- 如何在Ubuntu 16.04安装R
- 文巾解题 1711. 大餐计数
- Linux cal日历指令
- 微软开源故事 | 开启 .NET 开源革命
- php网页连mysql_php - 如何在单个网页上连接多个MySQL数据库?
- HDU - 1525
- java中数组的返回值是什么类型_面试必问:Java中String类型为什么设计成不可变的?...
- SPC-Light显示正常的日期与时间
- C++11中的原子操作(atomic operation)
- Python+Django实现智慧校园考试比赛系统
- Cadence Allegro PCB设计88问解析(十二) 之 Allegro中两种单位显示设置
- js判断是否是数组的几种方法
- css样式背景图片设置透明度,css如何设置背景图片的透明度
- 用Js怒刷LeetCode
- elasticsearch for windows
- 剑桥大学等提出MAGIC,一个即插即用、无需训练的图像-文本生成框架
- Atomic类如何保证原子性
- Archlinux双显卡安装NVIDIA闭源驱动
- Pygame小游戏:植物大战僵尸游戏真的有“毒”?戒不掉啊~
热门文章
- idea报错Module Project1 must not contain source root ...\Project1\src. The root already belongs to m
- idea报错Module Project1 must not contain source root ...\Project1\src. The root already belongs to .
- linux rm 某个时间以前,(转)linux的一个find命令配合rm删除某天前的文件
- matlab 求n 的和,MATLAB求1的阶乘加到n的阶乘和 不要现有的函数,要自己编写出来的...
- qt自定义含有拖动功能的窗口在点击窗口的下拉列表时窗口移动
- Python2.x 和 Python3.x,如何选择?
- matlab里inline定义矩阵,Matlab中的inline函数_matlab中inline函数
- python中的event_Python event
- mysql表里插不进去数据_Oracle数据中表值插不进去问题(转)
- oracle裁员原因_Oracle大幅度裁员意味着什么?