原文链接:python抓取美女图片实例

python脚本编程,和php类似,主要是作web项目及脚本抓取图片和文章、日志分析等,python比较有名的web开发框架有Django、Tornado、web.py、Bottle、Flask等,抓取图片的实例如下所示:

1、抓取煎蛋(http://jandan.net/)

#my blog:http://www.lylinux.org
import urllib2
from bs4 import BeautifulSoup
import socket#baseurl = "http://dbmeizi.com/"
baseurl = "http://jandan.net/ooxx/"
def user_agent(url):req_header = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}req_timeout = 20try:req = urllib2.Request(url,None,req_header)page = urllib2.urlopen(req,None,req_timeout)html = pageexcept urllib2.URLError as e:print e.messageexcept socket.timeout as e:user_agent(url)return pagedef page_loop(pageid):# url = baseurl+'?p=%s'%pageurl = baseurl + 'page-%s'%pageidprint urlpage = user_agent(url)soup = BeautifulSoup(page)total_img = 0img = soup.find_all(['img'])for myimg in img:link = myimg.get('src')total_img += 1print link#  content2 = urllib2.urlopen(link).read()content2 = user_agent(link).read()with open(u'D:\myimg'+'/'+link[-11:],'wb') as code:   code.write(content2)print total_imgreturn total_img
page_start = 1000
page_stop = 1100
total = 0
for i in range(page_start,page_stop):total+=page_loop(i)print total

2、抓取豆瓣妹子(http://dbmeizi.com/)

#my blog:http://www.lylinux.org
import urllib2
from bs4 import BeautifulSoup
import socketbaseurl = "http://dbmeizi.com/"
#伪装浏览器,以免被封
def user_agent(url):req_header = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}req_timeout = 20try:req = urllib2.Request(url,None,req_header)page = urllib2.urlopen(req,None,req_timeout)html = pageexcept urllib2.URLError as e:print e.messageexcept socket.timeout as e:user_agent(url)return htmldef page_loop(pageid):url = baseurl+'?p=%s'%pageidprint urlpage = user_agent(url)soup = BeautifulSoup(page)total_img = 0img = soup.find_all(['img'])for myimg in img:link = myimg.get('src')total_img += 1print link#  content2 = urllib2.urlopen(link).read()content2 = user_agent(link).read()#这句代码直接从OSC上面弄下来的#D:\myimg是保存路径,你可以自己改成自己的,但是路径必须要自己创建好with open(u'D:\myimg'+'/'+link[-11:],'wb') as code:code.write(content2)print total_imgreturn total_img
page_start = 0
page_stop = 4
total = 0
for i in range(page_start,page_stop):total+=page_loop(i)print total
#total就是统计下总共保存到本地的图片数量

网友有福了,闲得没事的时候可以下载看看,都很养眼呀。

python抓取美女图片实例相关推荐

  1. python爬虫学习基础教程,批量抓取美女图片!

    python的抓取功能其实是非常强大的,当然不能浪费,呵呵.下面就与大家分享一个python写的美女图自动抓取程序吧! 其中用到urllib2模块和正则表达式模块.下面直接上代码: 用python批量 ...

  2. python抓取网站图片_利用python抓取网站图片

    看了网上关于python抓取网站图片的例子,所以自己也尝试着写一个,但是发现这个网站的src不是标准的路径,需要自己添加前面的目录地址,尝试了几次也不成功,所以希望有经验的朋友指导下. 本人是初学者, ...

  3. python爬取美女图片的练习

    python 爬取美女图片的练习 主要使用 xpath 定位获取 图片的链接 本次练习使用到os库 ,lmxl库 , requests库 import requests from lxml impor ...

  4. python抓取网站图片_python抓取图片示例 python抓取网页上图片

    python抓取网页上图片 这个错误时是什么意思 下面是代码 import re import urllib.request imp正则表达式匹配的url有错误 for x in add: print ...

  5. python学习(24) 使用Xpath解析并抓取美女图片

    Xpath最初用来处理XML解析,同样适用于HTML文档处理.相比正则表达式更方便一些 Xpath基本规则 nodename 表示选取nodename 节点的所有子节点 / 表示当前节点的直接子节点 ...

  6. python抓取网页图片的小案例

    1.分析 ,要抓取的页面的信息以及对应的源码信息 blog.sina.com.cn/s/blog 93dc666c0101b1bj.html 2.代码模块: 导入正则表达的模块 导入url相关的模块 ...

  7. python抓取页面数据实例

    抓取文章数据保存在本地 #coding=utf-8 import urllib import redef getHtml(url):page = urllib.urlopen(url)html = p ...

  8. python抓取360图片之马自达

    #尝试抓取数量较多时,会提示403 forbidden,一次抓取20张图片就不会有问题 url = 'https://image.so.com/j?q=%E9%A9%AC%E8%87%AA%E8%BE ...

  9. 【爬虫实战】手把手教你使用python爬取美女图片

    本文目录 写作缘起 上代码 思路分析 效果展示 写在最后 写作缘起 用python爬虫实现的图片资源下载器,一页页下载图片过于缓慢,当我们要欣赏一些好看的图片时一页页翻太复杂了,干脆写一个图片下载器 ...

最新文章

  1. 必须掌握的八个DOS命令 [转]
  2. 设置vim的默认工作路径同时与自动设当前编辑的文件所在目录为当前工作路径不冲突...
  3. 通俗易懂,java8 .stream().map().collect()用法
  4. python一行代码打印Love心形
  5. oracle 执行多条insert 语句
  6. 软件portable
  7. 一套代码小程序WebNative运行的探索03——处理模板及属性
  8. 使用SQL语句操作数据
  9. 装x玩法:插上你的专有U盘才能开机
  10. 夯实Java基础系列21:Java8新特性终极指南
  11. python爬虫小案例
  12. web端调用高德API
  13. LeetCode-Hot100-两数之和
  14. 元素垂直居中,有几种方法?
  15. redis热key监控
  16. 培养数字化人才 护航大学生就业 千锋教研院2022年教研战略发布会隆重举行
  17. html文件无法复制粘贴,无法复制粘贴的解决办法
  18. UnicodeMath编码教程(转载)
  19. 微信公众号扫码模拟登录
  20. APC杂谈之PID Watch

热门文章

  1. python函数的用法字帖_GitHub - plateaukao/cns11643query: 用來查詢書法字帖的 python script,不用再層層的在官網上搜尋,只要輸入單詞即可...
  2. 最小生成树python算法实践
  3. 计算机毕业设计Java大学生社团管理系统(源码+系统+mysql数据库+lw文档)
  4. 初觉新奇,细思在理的刷三观之作 ——读《人类简史·从动物到上帝》有感
  5. 基数排序 | 主位优先 次位优先 | C语言
  6. Class4 Linux云上环境搭建学习笔记
  7. springmvc返回JSP源码
  8. 事件驱动组件libevent实战
  9. LK bootloader
  10. 根据某字段进行对象数组去重--方法之一