requests与PyQuery

requests

请求获取数据

PyQuery

PyQuery是一个类似于jQuery的解析网页工具,使用lxml操作xml和html文档,它的语法和jQuery很像。和XPATH,Beautiful Soup比起来,PyQuery更加灵活

方式一:通过网址初始化PyQyery对象

from pyquery import PyQuery as pq
s = '<html><title>PyQuery用法总结<title></html>'
doc = pq(s)
print(doc('title'))out:<title>PyQuery用法总结<title/></title><title/>

已字符串的形式传递给PyQuery.生成了一个PyQuery对象,通过该对象就可以访问字符串中的title节点。

print(doc('html'))out:<html><head><title>PyQuery用法总结</title></head></html>

初始化PyQuery对象之后,会把html文档补全,并且自动加上head节点。

方法二:URL网址初始化PyQyery对象

url = 'http://www.bigdata17.com'
doc = pq(url=url,encoding='utf-8')
print(doc('title'))out:<title>Home - Summer哥的自留地</title>

通过文件初始化PyQyery对象

很多时候我们会将网站爬取下来然后保存在本地磁盘

doc = pq(filename='test_pyquery.html',encoding='utf-8')
print(doc('title'))

访问节点属性

使用attr()方法访问节点的属性:返回的是第一个节点的属性值。

from pyquery import PyQuery as pq
li = pq('<li id="test1" class="test1"></li><li id="test2" class="test2"></li>')('li')
print(li.attr("id"))out:test1

items():获取取多个li节点的属性值

li = pq('<li id="test1" class="test1"></li><li id="test2" class="test2"></li>')('li')
print(li.items())
for item in li.items():print(item.attr("id"))

好累啊这个大哥写的不错,你们去看吧
https://blog.csdn.net/sinat_38682860/article/details/100165446

直接上项目

爬取的网址:https://pvp.qq.com/web201605/herolist.shtml
前端代码:

#导入库
import requests
from pyquery import PyQuery
#url
url='https://pvp.qq.com/web201605/herolist.shtml'
#获取
html=requests.get(url).content
#解析
doc=PyQuery(html)#pyquery的使用来展示css选择器的用法
#获取取多个li节点的属性值
items=doc(".herolist>li").items()
#循环
for item in items:a=1url=item.find('img').attr('src')#获取属性值#url存储英雄照片urls="http:"+urlprint(urls)#获取英雄的姓名name=item.find("a").text()print(name)#访问url获取照片url_content=requests.get(urls).content#存储格式为jpg格式可自行修改#with open('./picture/'+name+'.jpg',"wb")as file:#file.write(url_content)#print("正在下载:%s.....%s"%(name,urls))if a==1:break
print("x下载完毕")
out:
http://game.gtimg.cn/images/yxzj/img201606/heroimg/506/506.jpg
云中君
x下载完毕

零基础python爬虫基础之王者荣耀图片下载(超级简单)相关推荐

  1. Python爬虫爬取王者荣耀英雄人物高清图片

    Python爬虫爬取王者荣耀英雄人物高清图片 实现效果: 网页分析 从第一个网页中,获取每个英雄头像点击后进入的新网页地址,即a标签的 href 属性值: 划线部分的网址是需要拼接的 在每个英雄的具体 ...

  2. 利用python从网络上爬取图片_一篇文章教会你利用Python网络爬虫抓取王者荣耀图片...

    点击上方"IT共享之家",进行关注 回复"资料"可获赠Python学习福利 [一.项目背景] 王者荣耀作为当下最火的游戏之一,里面的人物信息更是惟妙惟肖,但受到 ...

  3. Python爬虫实战之王者荣耀全套皮肤采集~

    导语: 哈喽吖!铁汁们.王者荣耀这款手游,想必大家都玩过或听过,虽已运营7年,但热度依然不减当年,各种英雄配上各式各样的皮肤,甚是精美, 今天就教大家如何利用几行Python代码爬取王者荣耀全套皮肤~ ...

  4. python爬虫爬取王者荣耀官网全部英雄头像(源码分享)

    这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests import json from bs4 i ...

  5. python爬虫爬取王者荣耀官网全部装备图片(源码分享)

    这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests from bs4 import Beauti ...

  6. python爬虫——爬取王者荣耀全英雄皮肤

    爬取王者荣耀全英雄皮肤 #爬取王者荣耀全英雄皮肤 import requests import re#1.分析目标网页,确定爬取的url路径,headers参数 base_url='https://p ...

  7. python爬虫——爬取王者荣耀英雄出装建议(一)

    爬取装备列表 #爬取王者荣耀装备,并写入MySQL数据库import requests import re import pymysqldb=pymysql.connect('localhost',' ...

  8. Python爬虫之煎蛋网图片下载

    受程序员群的影响(自己污的本性),他们总是带我开车,想想我也该收集一些资料了(美女图片) 代码 import requests from lxml import etreeurls = ['http: ...

  9. 用Python爬取《王者荣耀》英雄皮肤数据并可视化分析,用图说话

    大家好,我是辰哥~ 今天辰哥带大家分析一波当前热门手游<王者荣耀>英雄皮肤,比如皮肤上线时间.皮肤类型(勇者:史诗:传说等).价格. 获取数据 数据来源于<王者荣耀官方网站>, ...

最新文章

  1. redis 主从复制的核心原理
  2. 每日求一录~20170704
  3. 第17件事 成功要素分析
  4. How to get user parameter settings
  5. rpm mysql 更改目录_rpm形式安装的MySQL服务 并 修改数据文件目录( red hat)_mysql...
  6. 批处理 java环境_java环境配置简单批处理方法一键OK
  7. 机器学习实战 | 数据探索
  8. [Linux 使用(2)] 64位Linux下安装jboss-as-7.1 以及jdk1.7
  9. int与string互转
  10. 迅捷cad_迅捷结构
  11. Pr入门系列之十四:处理音频
  12. Phoshop证件照换底色(红底换蓝底、白底)
  13. lightoj1224 DNA Prefix
  14. SMP、NUMA、MPP体系结构
  15. java多线程运行结果写入文件错误java.io.IOException: Stream closed
  16. 比越南妹划算 1元团购美女
  17. 《微信公众平台开发最佳实践》—— 1.3 微信公众平台的使用
  18. C++ Primer Plus (第六版)编程练习记录(chapter8 函数探幽)
  19. Explain how shipping point is determined?
  20. 哈工大2022软件构造Lab3

热门文章

  1. Kubernets 污点与容忍
  2. luogu3755 [CQOI2017]老C的任务
  3. 【Chrome Extensions】实现一个可以下载图片的Chrome插件
  4. 在同时使用label和input标签下下label绑定click事件执行两次的问题
  5. python meizitu
  6. 爬虫清洗:python strip()函数 去空格\n\r\t函数的用法
  7. C#面向对象编程的学习笔记
  8. 从入侵手段认识黑客的真面目
  9. cve-2021-22205复现
  10. java 统一日志_基于log4j实现统一日志管理