用Python爬虫爬取“女神吧”上的照片。
爬取的网页链接为https://tieba.baidu.com/p/5177270774
是一个美女警花哦!
所用Python环境为:python 3.3.2 用到的库为:urllib.request re
下面上代码:
import urllib.request import re#获得url的html 源码格式,其中使用了一个通过修改User-Agent实现了隐藏 def open_url(url):req = urllib.request.Request(url)req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36')page = urllib.request.urlopen(req)html = page.read().decode('utf-8') #二进制的utf-8要解码得到html代码(Unicode)return html#写正则表达式,获得html代码 def get_image(html):p = r'<img class="BDE_Image" src="([^"]+\.jpg)"' #正则表达式 [^]中的^是取反的意思temp = re.findall(p,html)i = 0page = 'C:/Users/lenovo/Desktop/mm/'for each in temp:i += 1file = open(page+str(i)+'.jpg','wb')each = urllib.request.urlopen(each).read() #将图片链接读出来写入文件中 file.write(each)file.close()def main(url):get_image(open_url(url))#规定只有直接运行这个模块才能执行主程序 if __name__ == '__main__':url = 'https://tieba.baidu.com/p/5177270774' main(url)
下面是爬取结果:
当然,这个爬虫是不完善的,除了四张美女图片外还多了一些慕名奇妙的图片,但是总的来说还是爬到了美女的图片的。
转载于:https://www.cnblogs.com/jeavenwong/p/7078230.html
用Python爬虫爬取“女神吧”上的照片。相关推荐
- Python爬虫:爬取知乎上的视频,并把下载链接保存到md文件中
Python爬虫:爬取知乎上的视频,并把下载链接保存到md文件中 1.需要的Python模块 主要是requests模块,用于得到的网页的数据 安装命令为:pip install requests 2 ...
- Python爬虫 | 爬取高质量小姐姐照片
Python爬虫 | 爬取高质量小姐姐照片 1.数据来源分析 2.获取author_id_list和img_id 3.制作detial 4.制作detial_list 5.数据保存 6.批量获取 7. ...
- 把url地址复制到粘贴板上_写个简单的python爬虫爬取堆糖上漂亮的小姐姐
简单的爬虫入门实战 最近刚学了python的爬虫,刚好可以用来爬取漂亮的图片作为壁纸,网上美图网站有很多,比如:花瓣,堆糖.它们请求图片数据的方式差不多类似,都是通过用户不断下滑加载新的图片,这种请求 ...
- 【爬虫】应用Python爬虫爬取豆瓣租房上的帖子信息
GitHub项目地址:https://github.com/Donvink/Spider.BC 哔哩哔哩代码讲解:https://b23.tv/waSfUa CSDN博客地址:https://blog ...
- python爬虫——爬取拉勾上的职位信息
爬取拉勾网站岗位数据 1.调用网页 查找网页链接规律 写一个for循环,爬取每一个网页的职位信息 def down():for i in range(1,4):if i == 1:strUrl = & ...
- python爬虫网页中的图片_Python爬虫爬取一个网页上的图片地址实例代码
本文实例主要是实现爬取一个网页上的图片地址,具体如下. 读取一个网页的源代码: import urllib.request def getHtml(url): html=urllib.request. ...
- Python爬虫---爬取数据(上)
又是女票,拿了3万多条的13年某地区的公司信息,但是三年过去了,工商局的注册信息发生了巨大变化,有的注册资本增加了,有的公司老板变多了,更有不少公司不存在了,因此,需要一份最新的信息以便于她进行使用. ...
- python爬取大众点评评论_python爬虫抓取数据 小试Python——爬虫抓取大众点评上的数据 - 电脑常识 - 服务器之家...
python爬虫抓取数据 小试Python--爬虫抓取大众点评上的数据 发布时间:2017-04-07
- python网易云_用python爬虫爬取网易云音乐
标签: 使用python爬虫爬取网易云音乐 需要使用的模块 只需要requests模块和os模块即可 开始工作 先去网易云音乐网页版找一下你想要听的歌曲点击进去.按键盘F12打开网页调试工具,点击Ne ...
- 使用Python爬虫爬取网络美女图片
代码地址如下: http://www.demodashi.com/demo/13500.html 准备工作 安装python3.6 略 安装requests库(用于请求静态页面) pip instal ...
最新文章
- php 如何把u5fb,php如何将json中的unicode编码转为汉字?
- JAVA 邮件发送工具类
- MATLAB中squeeze函数的作用
- 玩聚SR和FriendFeed的区别
- leetcode--数组(Medium1)
- 天池-街景字符编码识别2-数据读取与数据扩增
- C++ 位图及位图的实现
- weblogic多次连接后tcp服务堵塞_网络编程——服务器篇
- 无纸化民主测评考核系统领导班子干部微信二维码匿名评价投票打分平台
- 背包九讲Java版本
- 安卓蓝牙键盘按键映射_键盘按键映射器安卓版
- 测试项目实战----RuoYi后台管理系统
- 〖Python 数据库开发实战 - MySQL篇㉕〗- 数据更新操作 - UPDATE 语句
- 【搜索】桐桐的运输方案
- 【游戏客户端】实现刮刮乐效果
- SpinalNet: Deep Neural Network with Gradual Input
- Rokid从音箱产品到行业赋能:四年谋局,一鸣惊人
- vue使用腾讯地图定位以及地图组件使用
- 震惊!为了家人请不要这样对待自己的身体!
- kermit config files
热门文章
- 编译OpenJDK:invalid configuration Files: machine Files not recognized
- 由一个国标文件中,英文名与中文意思的对比,看用词的重要性
- 试论《华严经》来历的可信
- 空间如何超越极小而存在
- Java cmd常用命令_java cmd常用命令
- android notify,android4.0 MediaPlayer的notify监听机制的全面剖析
- 计算机应软件与理论学什么,计算机软件与理论
- McBSP初始化以及和EDMA的结合使用(C64X DSP)
- 3G dual band 使用策略
- Spring IOC核心源码学习