PyQuery 可让你用 jQuery 的语法来对 xml 进行操作,这和 jQuery 十分类似。如果利用 lxml,pyquery 对 xml 和 html 的处理将更快。

如果对 jQuery 熟悉,那么 PyQuery来解析文档就是不二之选!

下面的例子是爬取 'http://so.fengniao.com/index.php?action=Image&keyword=%E7%BE%8E%E6%99%AF' 这个页面的图片然后保存到本地

 1 from pyquery import PyQuery as pq
 2 import os,requests
 3 targetDir = os.path.join(os.path.dirname(os.path.abspath(__file__)),'imgs1')#图片保存的路径
 4 if not os.path.isdir(targetDir):#不存在创建路径
 5     os.mkdir(targetDir)
 6 doc = pq('http://so.fengniao.com/index.php?action=Image&keyword=%E7%BE%8E%E6%99%AF')
 7 imgs = doc('img')#取到所有图片
 8 list_imgs = []
 9 for img in imgs.items():
10     list_imgs.append(img.attr('src'))#将所有图片链接放到列表
11 num = 0
12 for url in list_imgs:
13     r = requests.get(url)
14     image_name = os.path.join(targetDir, str(num) + '.jpg')#指定目录,图片名'xx.jpg'
15     fw = open(image_name,'wb')
16     fw.write(r.content)
17     num +=1
18     fw.close()

转载于:https://www.cnblogs.com/nancyzhu/p/8449519.html

python3 爬虫神器pyquery的使用实例之爬网站图片相关推荐

  1. python3爬虫实例代码-Python3爬虫带上cookie的实例代码

    Cookie的英文原意是"点心",它是在客户端访问Web服务器时,服务器在客户端硬盘上存放的信息,好像是服务器发送给客户的"点心".服务器可以根据Cookie来 ...

  2. python contains类似函数_五步教会你用python爬虫神器PyQuery!(内含详细步骤和代码)...

    前言: 今天为大家带来的内容,是五步教会你用python爬虫神器PyQuery!(内含详细步骤和代码),在这里还是要啰嗦下,为了有更好的观赏性,大部分代码用图片的方式呈现出来!喜欢的话不忘点赞关注不迷 ...

  3. Python3 爬虫神器总结

    文章目录 前言 请求神器requests requests安装 requests简单示例 解析申请 Beautiful Soup Beautiful Soup安装 lxml安装 关注我的公众号,有 P ...

  4. Python3 爬虫学习笔记 C03 【Ajax 数据爬取】

    Python3 爬虫学习笔记第三章 -- [Ajax 数据爬取] 文章目录 [3.1]Ajax 简介 [3.2]解析真实地址提取 [3.1]Ajax 简介 Ajax - Asynchronous Ja ...

  5. python3 爬虫相关学习7:使用 BeautifulSoup下载网页图片到本地文件夹

    目录 1 一个爬图片pic的代码的例子 1.1 学习的原文章 1.2 原始代码的问题总结 问题1 问题2 问题3 其他问题 1.3 原始代码 2  直接在cmd里 python运行报错 和 处理 2. ...

  6. python3爬虫 selenium+pyquery爬取人才网简历实战

    不废话,直接贴代码,各位看官要是觉得可以的话,麻烦点个赞~ import requests, pymysql,pyquery,time from bs4 import BeautifulSoup fr ...

  7. python 福利_发现一个舔狗福利!这个Python爬虫神器太爽了,自动下载妹子图片!...

    对于Python的自动化测试或者是爬虫开发者来说,对于selenium库想必都听说过,selenium本身是作为Web应用测试工具,但是作为爬虫工具也有很广泛的用途. Selenium虽然好用,但是它 ...

  8. python3爬虫----人人贷散标用户信息爬取

    前提 本文基于此篇博文的实现思路以及给出的代码.不得不说,此博主心真的细,这个数据隐藏点都找到了,从而使得此爬虫的实现简单许多. 但我在使用博主代码时,发现人人贷网站有些许改变,于是对应代码我也相应做 ...

  9. Python3爬虫小项目(一)之爬取抖音的小视频

    版权声明:本文为博主原创文章,未经博主允许不得转载.https://blog.csdn.net/LInthunder/article/details/82929564 第一次写博客,请多多支持,下面这 ...

最新文章

  1. 从程序员的角度深入理解MySQL
  2. nuxt 头部引入js文件 第一次进入页面不加载js文件的解决方法
  3. MVC应用程序实现上传文件(续)
  4. logstic 回归文章链接
  5. Matlab 坐标轴比例一致导致图形变形
  6. mysql 显示前三项_详解MySQL三项实用开发知识
  7. SAP CRM和Cloud for Customer中的Event handler(事件处理器)
  8. JavaScript部分问题
  9. 从无到有:阿里巴巴中国站手机客户端项目设计
  10. 《asp.net夜话》一书视频ASP.NET夜话视频1-17章下载(ASP.NET夜话2009年5月9日更新)
  11. XamlWriter-将对象树写入Xaml
  12. SpringBoot中如何优雅的使用拦截器
  13. Java Socket编程(一)TCP/IP简介
  14. 在WebBrowser控件使用js调用C#方法
  15. 18位身份证标准及验证
  16. 会议OA项目之我的会议(会议排座送审)
  17. 【游戏】任天堂Nintendo Switch超详细购买/使用指南以及注意事项(根据自己使用持续更新中...)
  18. 一个机器人教小八_哈工程学生研发的水下机器人“敖小八”亮相浙江卫视
  19. 【Linux 从入门到精通】第一篇 常见指令及初识权限
  20. SQL语法 自然连接 外连接 内连接

热门文章

  1. Warning One or more files are in a conflicted state.
  2. 如何安装2018matlab,MATLAB 2018a软件安装教程
  3. 求最大公约数,最小公倍数
  4. 手机显示未连接网络连接到服务器是怎么回事,苹果浏览器显示未连接互联网是什么回事...
  5. 今年最后一月数据库排名公布!前三难以撼动!
  6. 生产质量分析方案,人机料法环全面解析,必看好文
  7. javac不是内部或外部命令,也不是可运行的程序 或批处理文件的细节问题(window10)
  8. events插件的使用
  9. 【Other】推荐点好听的钢琴曲
  10. Duang~ Golang 学习初探