第一次看到  http://bbs.byr.cn/#!article/Python/1859?p=1&au=lc10210103 看他说的很容易的样子就果断试一试了确实很简单,代码如下:

# -*- coding: utf-8 -*-import urllib2
import urllib
import sysclass get_mm_pic(object):#成员变量?page_num = 0mmurl = ""#定义成员变量初始化函数def __init__(self, page_num):self.page_num = page_numself.mmurl = "http://mm.taobao.com/json/request_top_list.htm?type=0&page="#定义主要的图片提取下载函数def get_pic(self):page_num = self.page_nummmurl = self.mmurlpage_count = 0mm_count = 0pic_count = 0while page_count < page_num:page_count += 1mm_count  = 0pic_count = 0url = mmurl + str(page_count)up = urllib2.urlopen(url)# cont get the url's contentcont = up.read()#print contpa = j = 0pmmh = pmmt = 0while True:ahref = '''<a href="http'''target = '''" target="'''pmmh = cont.find(ahref)#打开每一个MM的个人主页pmmt = cont.find(target, pmmh)if pmmh == -1:breakmodelurl = cont[pmmh + len(ahref) - 4 : pmmt]mup = urllib2.urlopen(modelurl)mm_count += 1pic_count = 0mcont = mup.read()img_style = "<img style="jpg = ".jpg"src = '''src="'''while True:pic_hptr = mcont.find(img_style)pic_tptr = mcont.find(jpg, pic_hptr)if pic_hptr == -1:breakmm_pic = mcont[pic_hptr : pic_tptr + len(jpg)]#定位到 src= 的位置 最终得到 mm图片的url mm_pic_urlpic_hptr = mm_pic.find(src)mm_pic_url = mm_pic[pic_hptr+len(src) : ]pic_count += 1print mm_pic_url#下载图片try:print ">>>downloading : page_" + str(page_count) + "_lady_" + str(mm_count) + "_pic_" + str(pic_count) + ".jpg......."urllib.urlretrieve(mm_pic_url, "page_"+str(page_count)+"_lady_"+str(mm_count)+"_pic_"+str(pic_count)+".jpg")except KeyboardInterrupt:print "SIGINT, exit..."sys.exit(0)except:pass#下一个MM个人主页mcont = mcont[pic_tptr : ]#下一个MM列表页cont = cont[pmmt+1 : ]def main(page_num):get_mm_pictures = get_mm_pic(page_num)get_mm_pictures.get_pic()if __name__ == '__main__':main(int(sys.argv[1]))

和拖延症战斗了半周终于完成了这个,和男程序员交流真是件痛苦的事情呀 >< 是吧罗瑞阳学长

python第一弹 爬虫淘女郎图片相关推荐

  1. 第一Python第一个爬虫项目

    第一Python第一个爬虫项目 完整代碼 import urllib.request url = "https://www.douban.com" headers = {" ...

  2. 学python第一弹 用IDLE启动python

    用IDLE启动python idle是python的一个python的外包shell平台 ,这是一个文本与程序交互的途径,打开idle之后,我们开始来点指令,看看是否可行, 在>>> ...

  3. python第一弹快速入门

    快速入门: 1.python的print语句,与子付款格式操作符(%)结合使用,可实现字符串替换功能. print "%s is number %d" % ("pytho ...

  4. Python第一弹--------初步了解Python

    Python是一种跨平台的语言,这意味着它能够运行在所有主要的操作系统中. 语法规范几乎同C语言. 字符串: 当像Python输入一个字符串时,首先要输入一个引号.单引号.双引号.三引号三者等价.通常 ...

  5. Python - 第一个爬虫代码,爬电子书下载地址

    ---------------------------------------------------------------------------------------------------- ...

  6. 获取frame_用Python获取可能是全网最全的杰尼龟表情包(第一弹)

    杰尼龟系列表情包在广大网友之间传递快乐,红极一时.我想是杰尼龟可爱的外表以及憨憨的形态,圆圆的脸蛋大大的眼睛,且其经常在剧中摆出各式夸张表情,因而被广大网友制成各式各样的表情包,并且深受沙雕网友的喜爱 ...

  7. Python|并发编程|爬虫|单线程|多线程|异步I/O|360图片|Selenium及JavaScript|Scrapy框架|BOM 和 DOM 操作简介|语言基础50课:学习(12)

    文章目录 系列目录 原项目地址 第37课:并发编程在爬虫中的应用 单线程版本 多线程版本 异步I/O版本 总结 第38课:抓取网页动态内容 Selenium 介绍 使用Selenium 加载页面 查找 ...

  8. 小白爬虫第一弹之抓取妹子图

    点击上方"程序员大咖",选择"置顶公众号" 关键时刻,第一时间送达! 这是一篇完全给新手写的爬虫教程 由于经常在群里装逼加上群主懒啊(你看有多久没更新文章就知道 ...

  9. python网络爬图_Python爬虫爬图片需要什么

    Python爬虫爬图片需要什么?下面用两种方法制作批量爬取网络图片的方法: 第一种方法:基于urllib实现 要点如下: 1.url_request = request.Request(url) 2. ...

最新文章

  1. 一种基于三代PacBio测序数据的补洞方法
  2. iOS 获取本地图片URL
  3. XenApp_XenDesktop_7.6实战篇之十四:XenDesktop虚拟桌面的交付
  4. 常考数据结构与算法:容器盛水问题
  5. hough变换检测直线 matlab,求能够运行的用matlab进行hough变换直线检测的程序。急!...
  6. java实验总结_Java实验总结——初学(上)
  7. java字符串拆分 空字符_Java字符串拆分
  8. 服务器win10系统开机慢,Win10系统开机慢怎么办 windows10开机慢的解决方法
  9. [Share]浏览器的历史
  10. Linux组件封装(一)中互斥锁MutexLock的封装
  11. c++反向输出一个三位数
  12. 专转本-矩阵的初等变换与线性方程组
  13. DOS命令:chkdsk
  14. 计算机网络显示红X无法连接,电脑无线网络连接不上,出现了红x❌
  15. 计算机联锁想系统包括哪几层,计算机联锁系统技术_习题.ppt
  16. matlab将图片旋转的代码_空间曲线绕空间直线旋转生成的旋转曲面方程
  17. 牧码客(卢益贵):专业取名软件——吉名宝
  18. IT运维人员,该如何规划自己的职业路?
  19. Falsehoods Programmers Believe About Names
  20. 面对DDoS攻击的威胁时应该怎么做呢?

热门文章

  1. 网页版音频播放器,歌词随音乐而动
  2. python多线程url采集器 + github_利用Python3.5多线程抓取妹子图
  3. EAUML日拱一卒-微信小程序实战:位置闹铃 (20)-发布微信小程序(续)
  4. AttributeError: ‘DatetimeProperties’ object has no attribute ‘weekday_name’ 的解决方法
  5. 计算机网络应用竞赛样题答案,计算机网络技术竞赛选拔赛试题(含答案).doc
  6. 你不知道的 async、await 魔鬼细节
  7. ImageWatch2019下载和安装
  8. 42岁巨星陨落!黑客之神Dan Kaminsky去世,曾因发现DNS安全漏洞一战成名
  9. 音频怎么在线转换成文字?试试这几个音频转文字的方法
  10. 游戏编程中的人工智能技术-演化算法入门