1 import re
 2 import urllib.request
 3
 4 # ------ 获取网页源代码的方法 ---
 5 def getHtml(url):
 6     page = urllib.request.urlopen(url)
 7     html = page.read()
 8     return html
 9
10 # ------ getHtml()内输入任意静态URL ------
11 html = getHtml("http://www.meizitu.com/a/5485.html")
12 # ------ 修改html对象内的字符编码为gbk或者UTF-8 ------
13 html = html.decode('gbk')
14
15 # ------ 获取所有图片地址的方法 ------
16
17     # ------ 利用正则表达式匹配网页内容找到图片地址 ------
18 reg = r'(http://[^\s]*\/[0-9][0-9].jpg)'
19 mmurl = re.findall(reg,html)
20     #reg = r'src="([.*\S]*\.jpg)" pic_ext="jpeg"'
21     #reg = r'src="(\.\.jpg)" pic_ext="jpeg"'
22 #    imgre = re.compile(reg)
23 #    imglist = re.findall(reg, html)
24 #    return imglist
25 #print(re.findall(reg, html))
26
27 x = 0
28 for imgurl in mmurl:
29     opener = urllib.request.build_opener()
30     opener.addheaders = [('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1941.0 Safari/537.36')]
31     urllib.request.install_opener(opener)
32     urllib.request.urlretrieve(imgurl, 'd://1/5485/%s.jpg' % x )
33     x += 1
34
35 print("All Done!")

转载于:https://www.cnblogs.com/feral/p/7503075.html

python meizitu相关推荐

  1. 【Python爬虫案例学习4】Python 爬取meizitu

    基本配置: Python版本:3.6 开发工具:pycharm 403是返回的状态码 403错误,表示资源不可用.服务器理解客户的请求,但拒绝处理它,通常由于服务器上文件或目录的权限设置导致的WEB访 ...

  2. python 爬虫源代码-从零开始学Python网络爬虫_源代码.rar

    [实例简介] [实例截图] [核心代码] 从零开始学Python网络爬虫_源代码_1 ├── 58project │ ├── __pycache__ │ │ ├── channel_extract.c ...

  3. python下载图片的命令_网上的图片不知道怎么批量下载?python教你怎么把网站上面的图片都爬下来...

    妹子图网站----前言 从今天开始就要撸起袖子,直接写Python爬虫了,学习语言最好的办法就是有目的的进行,所以,接下来我将用10+篇的博客,写爬图片这一件事情.希望可以做好. 为了写好爬虫,我们需 ...

  4. 【python】python 爬虫(python抓取网站的图片)

    文章目录 1.什么是爬虫 2.爬虫的思想 一些知识 1 . 环境的搭建请看: 2 . 3 .:Requests urllib的升级版本打包了全部功能并简化了使用方法(点我查看官方文档) 4 : bea ...

  5. android怎么让图片显示在button上面_网上的图片不知道怎么批量下载?python教你怎么把网站上面的图片都爬下来...

    ## **妹子图网站----前言** 从今天开始就要撸起袖子,直接写Python爬虫了,学习语言最好的办法就是有目的的进行,所以,接下来我将用10+篇的博客,写`爬图片`这一件事情.希望可以做好. 为 ...

  6. python爬虫爬妹子图_【爬虫】直接上干货-爬取妹子图整站图片

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 #coding=utf-8 import os import requests from lxml import etree import time cl ...

  7. 教你用Python爬取妹子图APP

    教你用Python爬美之图APP全站图片 爬取结果 程序只运行了2h,最后认为程序没有问题了就关了(我可不是去杀生去了...... 运行环境 Python 3.5+ Windows 10 VSCode ...

  8. Python 爬虫入门(二)——爬取妹子图

    Python 爬虫入门 听说你写代码没动力?本文就给你动力,爬取妹子图.如果这也没动力那就没救了. GitHub 地址: https://github.com/injetlee/Python/blob ...

  9. python妹子图软件下载_python3下载妹子图,你懂的。

    1.[代码][Python]代码 #author:lenglingx@gmail.com #date:2014-12-08 #coding:utf-8 import os import sys imp ...

最新文章

  1. Java.util包中常用的类
  2. python运维常用模块-运维常用python库模块
  3. nginx配置url重定向-反向代理
  4. 帧率ffmepg 摄像头_监控摄像头的硬盘内存选择方法
  5. 完全独立与IIS的后门
  6. gcc怎么编写c语言程序,gcc如何编译C语言程序
  7. win10系统bat脚本自启动程序、修改壁纸、更换主题区分主副屏壁纸
  8. xhEditor使用方法2
  9. 2019西安交大计算机专业研究生分数线,西安交通大学2019年考研分数线公布
  10. 大二下学期ACM比赛总结
  11. 实现内网穿透,个人电脑秒变服务器
  12. 浏览器的审查元素,这是一个神奇的玩意儿
  13. 高中数学必考公式全总结
  14. 7-5 盲盒包装流水线
  15. jquery遍历得到的 Map 数据,
  16. 关于语义分析的简单总结
  17. 通过存档数据和视频图像处理估计地铁留守乘客
  18. 密码加密技术(MD5)
  19. 数字金融崛起,科技撬动增长
  20. Wechaty Plugin|实现一个微信机器人几行代码即可

热门文章

  1. python关闭文件os_python_文件的打开和关闭
  2. cocos creator切换场景闪退_#Cocos Creator# 为什么音乐音效在场景切换的时候自动停止了?...
  3. python调用高德api_python 高德api接口
  4. COJ 0580 4021征兵方案
  5. zabbix 自动发现/自定义宏
  6. IoT嵌入式硬件--DC/DC
  7. 爱宝A-1180热转印条码打印机 打印乱码,对不齐的问题
  8. mysql 100个标题_100个超强吸引人的标题100个吸引人的标题
  9. ubuntu服务器登桌面,Ubuntu Server安装桌面环境实现图形化访问 | 聂扬帆博客
  10. 用PS把真人照片转素描手绘效果