初识爬虫

  • 爬取王者荣耀英雄故事和技能

爬取王者荣耀英雄故事和技能

源码奉上

import requests
import re
import os
from lxml import etree
if __name__ == '__main__':#创建一个文件夹wz#打算爬取皮肤图片,铭文,出装等 先创建一个文件夹使用if not os.path.exists('./wz'):os.mkdir('./wz')#爬取的网站url = 'https://pvp.qq.com/web201605/herolist.shtml'#伪装headers = {'User-Agent': 'Mozilla/5.0 (Windows'' NT 10.0; WOW64)''AppleWebK''it/537.36 (KHTML, like Gecko)'' Chrome/85.0.4183.102 Sa''fari/537.36'}#爬取源码数据page= requests.get(url=url,headers=headers)#防止乱码page.encoding='gbk'page_text=page.text# print(page_text)#进行数据解析tree= etree.HTML(page_text)#定位到所需数据list_w=tree.xpath('//ul[@class="herolist clearfix"]/li')for li in list_w:#爬取英雄名字cover_name=li.xpath('./a/text()')[0]#爬取单个英雄对应的网址w='https://pvp.qq.com/web201605/'+li.xpath('./a/@href')[0]# print(cover_name)# print(w)page_w=requests.get(url=w,headers=headers)page_w.encoding='gbk'# 爬取英雄页面源码数据page_w_text=page_w.text#print(page_w_text)#数据解析(英雄故事)tree_story =etree.HTML(page_w_text)list_story=tree_story.xpath('//div[@class="pop-bd"]')for li_story in list_story:#拿到英雄故事TXT文本story=li_story.xpath('./p/text()')print(cover_name,':',story)tree_skill = etree.HTML(page_w_text)list_skill=tree_skill.xpath('//div[@class="skill-show"]/div')for li_skill in list_skill:#拿到英雄技能和技能描述skill=li_skill.xpath('./p[@class="skill-name"]/b/text()')+li_skill.xpath('./p[@class="skill-desc"]/text()')# skill_desc=li_skill.xpath('./p[@class="skill-desc"]/text()')print(skill)

爬虫爬取王者荣耀 英雄故事 和技能相关推荐

  1. Java爬虫 --- 爬取王者荣耀英雄图片

    Java爬虫 - 爬取王者荣耀英雄图片 import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup.nodes.Docu ...

  2. Python爬虫爬取王者荣耀英雄人物高清图片

    Python爬虫爬取王者荣耀英雄人物高清图片 实现效果: 网页分析 从第一个网页中,获取每个英雄头像点击后进入的新网页地址,即a标签的 href 属性值: 划线部分的网址是需要拼接的 在每个英雄的具体 ...

  3. 爬虫爬取王者荣耀英雄

    爬虫爬取王者荣耀英雄 爬取英雄所在标签 得到英雄详情页与图片地址 爬取英雄所在标签 import requests import bs4 from bs4 import BeautifulSoup # ...

  4. python3APP爬虫--爬取王者荣耀英雄图片(附源码)

    文章目录 一.准备工作 1.工具 二.思路 1.整体思路 2.爬虫思路 三.获取数据 1.抓包 2.分析json 四.撰写爬虫 五.得到数据 六.总结 之前有写过抖音app用户信息爬虫,因为当时是第一 ...

  5. python爬虫——爬取王者荣耀英雄出装建议(一)

    爬取装备列表 #爬取王者荣耀装备,并写入MySQL数据库import requests import re import pymysqldb=pymysql.connect('localhost',' ...

  6. python3APP爬虫--爬取王者荣耀小姐姐cosplay照片(附源码)

    文章目录 一.絮叨 1.接上 2.启下 二.代码 三.查看数据 四.总结 一.絮叨 1.接上 自己挖的坑,自己填.上一篇python3APP爬虫–爬取王者荣耀英雄图片(附源码)爬取了王者荣耀英雄图片, ...

  7. Python爬虫——手把手教你爬取王者荣耀英雄皮肤

    大家好!我是霖hero 大家知道目前最火的手游是哪个嘛,没错,就是王者荣耀,这款手游想必大家都听过或者玩过吧,里面有106个英雄,几百个英雄皮肤,今天我来手把手教你们把几百个皮肤都爬取下来. 目录 P ...

  8. 教你用python爬取王者荣耀英雄皮肤图片,并将图片保存在各自英雄的文件夹中。(附源码)

    教你用python爬取王者荣耀英雄皮肤图片,并将图片保存在各自英雄的文件夹中.(附源码) 代码展示: 保存在各自的文件夹中 美么? 让我们开始爬虫之路 开发环境 windows 10 python3. ...

  9. Python批量爬取王者荣耀英雄高清壁纸

    Python批量爬取王者荣耀英雄高清壁纸 文章目录 Python批量爬取王者荣耀英雄高清壁纸 前言 爬虫步骤 python代码实现 总结 前言 很多喜欢玩王者的朋友很希望把王者荣耀的英雄图片拿来做壁纸 ...

最新文章

  1. HZOJ matrix
  2. 转载--CentOS 6.3下部署LVS(NAT)+keepalived实现高性能高可用负载均衡
  3. 2018高中计算机会考知识点,2018高中物理会考知识点总结
  4. 用Word写博客园文章
  5. Android 如何添加一种锁屏方式
  6. go rpc安装方法
  7. 记录远程桌面登录者的IP和MAC
  8. PHP RSA2 签名算法
  9. python运行中更改代码_运行时更改python源代码
  10. Quantum Machine Learning——QML学习记录00
  11. C语言学习-翁凯(第三章笔记)
  12. matlab中进行太阳能电池模型,基于Matlab的光伏发电系统仿真研究
  13. python如何实现手眼定标_kafka基础和python如何操作kafka
  14. WSJ Merkel Top On Forbes' Most Powerful Women List For 4th Year
  15. Linux找回删除文件
  16. 使用Python扩展库numpy中的piecewise()函数实现分段函数模拟兔子的行走轨迹,然后使用matplotlib.pyplot中的plot函数绘制折线图表示兔子和乌龟的时间位移图,并添加坐标
  17. 京东云加速扩展“朋友圈” 火力全开大展生态“云”图
  18. 在 Node.js 中操作 Redis
  19. nginx 在海思平台移植编译
  20. compact紧凑算法思想

热门文章

  1. 【Java】公式计算 | JEXL
  2. 一张金融IC卡的交易流程(二)-----基本测试环境及借贷记交易流程(银联,交通部均为此流程)
  3. matlab胞元数组
  4. 新品周刊 | 昕诺飞发布飞利浦智能照明产品;AO史密斯推出新品空气净化器
  5. 解决IDEA导包时自动使用*号替代具体类名问题
  6. 根据拼音首字母筛选人名 1
  7. 选择一款舒心的MD编辑器
  8. java基本数据_Java基本数据类型-Java基本数据类型大小-嗨客网
  9. oracle--14触发器1
  10. ADI demo PL工程的编译-以adrv9371x_zc706为例子之使用Cygwin