python meizitu
1 import re 2 import urllib.request 3 4 # ------ 获取网页源代码的方法 --- 5 def getHtml(url): 6 page = urllib.request.urlopen(url) 7 html = page.read() 8 return html 9 10 # ------ getHtml()内输入任意静态URL ------ 11 html = getHtml("http://www.meizitu.com/a/5485.html") 12 # ------ 修改html对象内的字符编码为gbk或者UTF-8 ------ 13 html = html.decode('gbk') 14 15 # ------ 获取所有图片地址的方法 ------ 16 17 # ------ 利用正则表达式匹配网页内容找到图片地址 ------ 18 reg = r'(http://[^\s]*\/[0-9][0-9].jpg)' 19 mmurl = re.findall(reg,html) 20 #reg = r'src="([.*\S]*\.jpg)" pic_ext="jpeg"' 21 #reg = r'src="(\.\.jpg)" pic_ext="jpeg"' 22 # imgre = re.compile(reg) 23 # imglist = re.findall(reg, html) 24 # return imglist 25 #print(re.findall(reg, html)) 26 27 x = 0 28 for imgurl in mmurl: 29 opener = urllib.request.build_opener() 30 opener.addheaders = [('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1941.0 Safari/537.36')] 31 urllib.request.install_opener(opener) 32 urllib.request.urlretrieve(imgurl, 'd://1/5485/%s.jpg' % x ) 33 x += 1 34 35 print("All Done!")
转载于:https://www.cnblogs.com/feral/p/7503075.html
python meizitu相关推荐
- 【Python爬虫案例学习4】Python 爬取meizitu
基本配置: Python版本:3.6 开发工具:pycharm 403是返回的状态码 403错误,表示资源不可用.服务器理解客户的请求,但拒绝处理它,通常由于服务器上文件或目录的权限设置导致的WEB访 ...
- python 爬虫源代码-从零开始学Python网络爬虫_源代码.rar
[实例简介] [实例截图] [核心代码] 从零开始学Python网络爬虫_源代码_1 ├── 58project │ ├── __pycache__ │ │ ├── channel_extract.c ...
- python下载图片的命令_网上的图片不知道怎么批量下载?python教你怎么把网站上面的图片都爬下来...
妹子图网站----前言 从今天开始就要撸起袖子,直接写Python爬虫了,学习语言最好的办法就是有目的的进行,所以,接下来我将用10+篇的博客,写爬图片这一件事情.希望可以做好. 为了写好爬虫,我们需 ...
- 【python】python 爬虫(python抓取网站的图片)
文章目录 1.什么是爬虫 2.爬虫的思想 一些知识 1 . 环境的搭建请看: 2 . 3 .:Requests urllib的升级版本打包了全部功能并简化了使用方法(点我查看官方文档) 4 : bea ...
- android怎么让图片显示在button上面_网上的图片不知道怎么批量下载?python教你怎么把网站上面的图片都爬下来...
## **妹子图网站----前言** 从今天开始就要撸起袖子,直接写Python爬虫了,学习语言最好的办法就是有目的的进行,所以,接下来我将用10+篇的博客,写`爬图片`这一件事情.希望可以做好. 为 ...
- python爬虫爬妹子图_【爬虫】直接上干货-爬取妹子图整站图片
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 #coding=utf-8 import os import requests from lxml import etree import time cl ...
- 教你用Python爬取妹子图APP
教你用Python爬美之图APP全站图片 爬取结果 程序只运行了2h,最后认为程序没有问题了就关了(我可不是去杀生去了...... 运行环境 Python 3.5+ Windows 10 VSCode ...
- Python 爬虫入门(二)——爬取妹子图
Python 爬虫入门 听说你写代码没动力?本文就给你动力,爬取妹子图.如果这也没动力那就没救了. GitHub 地址: https://github.com/injetlee/Python/blob ...
- python妹子图软件下载_python3下载妹子图,你懂的。
1.[代码][Python]代码 #author:lenglingx@gmail.com #date:2014-12-08 #coding:utf-8 import os import sys imp ...
最新文章
- Java.util包中常用的类
- python运维常用模块-运维常用python库模块
- nginx配置url重定向-反向代理
- 帧率ffmepg 摄像头_监控摄像头的硬盘内存选择方法
- 完全独立与IIS的后门
- gcc怎么编写c语言程序,gcc如何编译C语言程序
- win10系统bat脚本自启动程序、修改壁纸、更换主题区分主副屏壁纸
- xhEditor使用方法2
- 2019西安交大计算机专业研究生分数线,西安交通大学2019年考研分数线公布
- 大二下学期ACM比赛总结
- 实现内网穿透,个人电脑秒变服务器
- 浏览器的审查元素,这是一个神奇的玩意儿
- 高中数学必考公式全总结
- 7-5 盲盒包装流水线
- jquery遍历得到的 Map 数据,
- 关于语义分析的简单总结
- 通过存档数据和视频图像处理估计地铁留守乘客
- 密码加密技术(MD5)
- 数字金融崛起,科技撬动增长
- Wechaty Plugin|实现一个微信机器人几行代码即可
热门文章
- python关闭文件os_python_文件的打开和关闭
- cocos creator切换场景闪退_#Cocos Creator# 为什么音乐音效在场景切换的时候自动停止了?...
- python调用高德api_python 高德api接口
- COJ 0580 4021征兵方案
- zabbix 自动发现/自定义宏
- IoT嵌入式硬件--DC/DC
- 爱宝A-1180热转印条码打印机 打印乱码,对不齐的问题
- mysql 100个标题_100个超强吸引人的标题100个吸引人的标题
- ubuntu服务器登桌面,Ubuntu Server安装桌面环境实现图形化访问 | 聂扬帆博客
- 用PS把真人照片转素描手绘效果