php 爬虫图片代码,python爬虫入门教程之糗百图片爬虫代码分享
\\n
')
#用来合成网页的URL
nexturl1 = "http://m.qiushibaike.com/imgrank/page/"
nexturl2 = "?s=4582487&slow"
#页数计数
count = 1
#设置抓取的页数
while count < 3:
print "Page " + str(count) + "\n"
myurl = nexturl1 + str(count) + nexturl2
myres = urllib2.urlopen(myurl)#抓取网页
mypage = myres.read()#读取网页内容
ucpage = mypage.decode("utf-8") #转码
mat = pat.findall(ucpage)#用正则表达式抓取图片地址
count += 1;
if len(mat):
for item in mat:
print "url: " + item + "\n"
fnp = re.compile('/(\w+\.\w+)$')#下面三行分离出图片文件的名称
fnr = fnp.findall(item)
fname = fnr[0]
urllib.urlretrieve(item, fname)#下载图片
else:
print "no data"
使用方法:新建一个practice文件夹,将源代码保存为qb.py文件,并放在practice文件夹中,在命令行里执行python qb.py,即开始下载图片。可以修改源代码里面的while语句设置下载的页数。
本文原创发布php中文网,转载请注明出处,感谢您的尊重!
php 爬虫图片代码,python爬虫入门教程之糗百图片爬虫代码分享相关推荐
- python爬虫入门教程(三):淘女郎爬虫 ( 接口解析 | 图片下载 )
2019/10/28更新 网站已改版,代码已失效(其实早就失效了,但我懒得改...)此博文仅供做思路上的参考 代码使用python2编写,因已失效,就未改写成python3 爬虫入门系列教程: pyt ...
- python菜鸟工具-终于清楚python菜鸟入门教程
Python是一款功能强大的脚本语言,具有丰富和强大的库,重要的是,它还具有很强的可读性,易用易学,非常适合编程初学者入门.以下是小编为你整理的python菜鸟入门教程 环境配置:下载Python并安 ...
- Python基础入门教程:使用 Python 3 协程快速获得一个代理池
Python基础入门教程:使用 Python 3 协程快速获得一个代理池 前言 在执行 IO 密集型任务的时候,程序会因为等待 IO 而阻塞.比如我们使用 requests 库来进行网络爬虫请求的话, ...
- python新手入门教程思路-Python新手入门教程_教你怎么用Python做数据分析
Python新手入门教程_教你怎么用Python做数据分析 跟大家讲了这么多期的Python教程,有小伙伴在学Python新手教程的时候说学Python比较复杂的地方就是资料太多了,比较复杂.很多网上 ...
- Python从入门到高手的80行代码
文章目录 基础入门 菜鸟提升 基础晋级 高手之路 内置包库 奇技淫巧 最新版: Python从入门到入土的90行代码 基础入门 1 python 即在命令行输入python,进入Python的开发环境 ...
- 编程入门python语言是多大孩子学的-不学点编程,将来怎么给孩子辅导作业―Python新手入门教程...
为了填满AI时代的人才缺口,编程语言教育都从娃娃抓起了!如果你还不懂Python是什么将来怎么给孩子辅导作业呢? Python新手入门教程 近期,浙江省信息技术课程改革方案出台,Python言语现已断 ...
- python基础教程是什么语言-终于懂得python中文入门教程
Python作为一门新型的编程语言(一般常用作脚本语言)很受欢迎,毕竟相对其他的编程语言(Java ,C#等)来说比较容易入手.那么,在刚开始学习Python时有哪些疑难点需要掌握呢?以下是小编为你整 ...
- python免费入门手册-Python 基础入门教程
Python是一种解释型.面向对象.动态数据类型的高级程序设计语言. Python由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年. <Python 基础入 ...
- Python SQLAlchemy入门教程
原文:https://www.cnblogs.com/ybjourney/p/11832045.html Python SQLAlchemy入门教程 一.介绍 关于ORM 为什么用sqlalchemy ...
- 超全面Python基础入门教程【十天课程】博客笔记汇总表
目录 1.学习地址 2.下载地址[视频.源码.课件.软件] 3.详细博客笔记 Day 01 Day 02 Day 03 Day 04 Day 05 Day 06 Day 07 Day 08 Day 0 ...
最新文章
- plt.xlabel 'str' object is not callable
- android 禁用剪切板_Android EditText禁止复制粘贴
- 计算机无法安装手机数据线,连接电脑,详细教您手机数据线连接电脑没反应该怎么解决...
- LeetCode动态规划 斐波那契数
- 结构体内部申请空间_墙体的重要承重结构以及作用方向分类
- mybatis注解开发_快速搭建MyBatis开发环境(配置版+注解版)
- (转)敲黑板:IT项目出现问题,足以拖垮整个公司
- STM32 cubemx驱动ws2812b灯条
- 20172328《程序设计与数据结构》第二周学习总结
- 使用ECS和OSS搭建个人网盘(阿里云官方)
- FPGA SDRAM接口设计(一)初窥门径
- 蚂蚁金服缘何自研Service Mesh?
- 曝新款苹果手机将采用低功耗微处理器,Find My定位在关机状态下也能使用
- VideoProc for mac(全能视频处理软件)
- MySQL中的char和varcharmysql中varchar能存多少汉字、数字,以及varchar(100)和varchar(10)的区别
- 深度学习工作站由于显卡驱动问题导致不能使用GPU
- Jackson 序列化 自定义注解处理Null 值
- redhat激活管理
- 智慧路灯存在的隐患缺陷问题有哪些?解决智慧路灯隐患处理措施!
- 【内含实物图】一款可独立行走且支持远程对话的微型巡逻摄像头——嵌入式方案
热门文章
- boost LNK2005 重定义错误
- 设置虚拟机桥接模式以及解决桥接模式上不了网以及ping不通主机的问题
- Angular.js(出库列表页)
- 荣耀 android 11 rom,华为荣耀10官方固件rom刷机包_华为荣耀10完整版系统升级包
- steamcommunity本地反代443端口/80端口被占用解决办法
- 数学建模——模拟退火优化投影寻踪
- 【转载】三方框架整理
- 【SVM分类】基于改进鲸鱼算法优化最小二乘支持向量机实现数据分类matlab代码
- 知识总结2:Django常见面试题总结(持续更新)
- 感性电路电流计算_电工初学者会正确计算负载功率吗?一篇文章彻底教会你