python3 爬虫神器pyquery的使用实例之爬网站图片
PyQuery
可让你用 jQuery 的语法来对 xml 进行操作,这和 jQuery 十分类似。如果利用 lxml,pyquery 对 xml 和 html 的处理将更快。
如果对 jQuery
熟悉,那么 PyQuery
来解析文档就是不二之选!
下面的例子是爬取 'http://so.fengniao.com/index.php?action=Image&keyword=%E7%BE%8E%E6%99%AF' 这个页面的图片然后保存到本地
1 from pyquery import PyQuery as pq 2 import os,requests 3 targetDir = os.path.join(os.path.dirname(os.path.abspath(__file__)),'imgs1')#图片保存的路径 4 if not os.path.isdir(targetDir):#不存在创建路径 5 os.mkdir(targetDir) 6 doc = pq('http://so.fengniao.com/index.php?action=Image&keyword=%E7%BE%8E%E6%99%AF') 7 imgs = doc('img')#取到所有图片 8 list_imgs = [] 9 for img in imgs.items(): 10 list_imgs.append(img.attr('src'))#将所有图片链接放到列表 11 num = 0 12 for url in list_imgs: 13 r = requests.get(url) 14 image_name = os.path.join(targetDir, str(num) + '.jpg')#指定目录,图片名'xx.jpg' 15 fw = open(image_name,'wb') 16 fw.write(r.content) 17 num +=1 18 fw.close()
转载于:https://www.cnblogs.com/nancyzhu/p/8449519.html
python3 爬虫神器pyquery的使用实例之爬网站图片相关推荐
- python3爬虫实例代码-Python3爬虫带上cookie的实例代码
Cookie的英文原意是"点心",它是在客户端访问Web服务器时,服务器在客户端硬盘上存放的信息,好像是服务器发送给客户的"点心".服务器可以根据Cookie来 ...
- python contains类似函数_五步教会你用python爬虫神器PyQuery!(内含详细步骤和代码)...
前言: 今天为大家带来的内容,是五步教会你用python爬虫神器PyQuery!(内含详细步骤和代码),在这里还是要啰嗦下,为了有更好的观赏性,大部分代码用图片的方式呈现出来!喜欢的话不忘点赞关注不迷 ...
- Python3 爬虫神器总结
文章目录 前言 请求神器requests requests安装 requests简单示例 解析申请 Beautiful Soup Beautiful Soup安装 lxml安装 关注我的公众号,有 P ...
- Python3 爬虫学习笔记 C03 【Ajax 数据爬取】
Python3 爬虫学习笔记第三章 -- [Ajax 数据爬取] 文章目录 [3.1]Ajax 简介 [3.2]解析真实地址提取 [3.1]Ajax 简介 Ajax - Asynchronous Ja ...
- python3 爬虫相关学习7:使用 BeautifulSoup下载网页图片到本地文件夹
目录 1 一个爬图片pic的代码的例子 1.1 学习的原文章 1.2 原始代码的问题总结 问题1 问题2 问题3 其他问题 1.3 原始代码 2 直接在cmd里 python运行报错 和 处理 2. ...
- python3爬虫 selenium+pyquery爬取人才网简历实战
不废话,直接贴代码,各位看官要是觉得可以的话,麻烦点个赞~ import requests, pymysql,pyquery,time from bs4 import BeautifulSoup fr ...
- python 福利_发现一个舔狗福利!这个Python爬虫神器太爽了,自动下载妹子图片!...
对于Python的自动化测试或者是爬虫开发者来说,对于selenium库想必都听说过,selenium本身是作为Web应用测试工具,但是作为爬虫工具也有很广泛的用途. Selenium虽然好用,但是它 ...
- python3爬虫----人人贷散标用户信息爬取
前提 本文基于此篇博文的实现思路以及给出的代码.不得不说,此博主心真的细,这个数据隐藏点都找到了,从而使得此爬虫的实现简单许多. 但我在使用博主代码时,发现人人贷网站有些许改变,于是对应代码我也相应做 ...
- Python3爬虫小项目(一)之爬取抖音的小视频
版权声明:本文为博主原创文章,未经博主允许不得转载.https://blog.csdn.net/LInthunder/article/details/82929564 第一次写博客,请多多支持,下面这 ...
最新文章
- 从程序员的角度深入理解MySQL
- nuxt 头部引入js文件 第一次进入页面不加载js文件的解决方法
- MVC应用程序实现上传文件(续)
- logstic 回归文章链接
- Matlab 坐标轴比例一致导致图形变形
- mysql 显示前三项_详解MySQL三项实用开发知识
- SAP CRM和Cloud for Customer中的Event handler(事件处理器)
- JavaScript部分问题
- 从无到有:阿里巴巴中国站手机客户端项目设计
- 《asp.net夜话》一书视频ASP.NET夜话视频1-17章下载(ASP.NET夜话2009年5月9日更新)
- XamlWriter-将对象树写入Xaml
- SpringBoot中如何优雅的使用拦截器
- Java Socket编程(一)TCP/IP简介
- 在WebBrowser控件使用js调用C#方法
- 18位身份证标准及验证
- 会议OA项目之我的会议(会议排座送审)
- 【游戏】任天堂Nintendo Switch超详细购买/使用指南以及注意事项(根据自己使用持续更新中...)
- 一个机器人教小八_哈工程学生研发的水下机器人“敖小八”亮相浙江卫视
- 【Linux 从入门到精通】第一篇 常见指令及初识权限
- SQL语法 自然连接 外连接 内连接
热门文章
- Warning One or more files are in a conflicted state.
- 如何安装2018matlab,MATLAB 2018a软件安装教程
- 求最大公约数,最小公倍数
- 手机显示未连接网络连接到服务器是怎么回事,苹果浏览器显示未连接互联网是什么回事...
- 今年最后一月数据库排名公布!前三难以撼动!
- 生产质量分析方案,人机料法环全面解析,必看好文
- javac不是内部或外部命令,也不是可运行的程序 或批处理文件的细节问题(window10)
- events插件的使用
- 【Other】推荐点好听的钢琴曲
- Duang~ Golang 学习初探