爬虫爬取王者荣耀 英雄故事 和技能
初识爬虫
- 爬取王者荣耀英雄故事和技能
爬取王者荣耀英雄故事和技能
源码奉上
import requests
import re
import os
from lxml import etree
if __name__ == '__main__':#创建一个文件夹wz#打算爬取皮肤图片,铭文,出装等 先创建一个文件夹使用if not os.path.exists('./wz'):os.mkdir('./wz')#爬取的网站url = 'https://pvp.qq.com/web201605/herolist.shtml'#伪装headers = {'User-Agent': 'Mozilla/5.0 (Windows'' NT 10.0; WOW64)''AppleWebK''it/537.36 (KHTML, like Gecko)'' Chrome/85.0.4183.102 Sa''fari/537.36'}#爬取源码数据page= requests.get(url=url,headers=headers)#防止乱码page.encoding='gbk'page_text=page.text# print(page_text)#进行数据解析tree= etree.HTML(page_text)#定位到所需数据list_w=tree.xpath('//ul[@class="herolist clearfix"]/li')for li in list_w:#爬取英雄名字cover_name=li.xpath('./a/text()')[0]#爬取单个英雄对应的网址w='https://pvp.qq.com/web201605/'+li.xpath('./a/@href')[0]# print(cover_name)# print(w)page_w=requests.get(url=w,headers=headers)page_w.encoding='gbk'# 爬取英雄页面源码数据page_w_text=page_w.text#print(page_w_text)#数据解析(英雄故事)tree_story =etree.HTML(page_w_text)list_story=tree_story.xpath('//div[@class="pop-bd"]')for li_story in list_story:#拿到英雄故事TXT文本story=li_story.xpath('./p/text()')print(cover_name,':',story)tree_skill = etree.HTML(page_w_text)list_skill=tree_skill.xpath('//div[@class="skill-show"]/div')for li_skill in list_skill:#拿到英雄技能和技能描述skill=li_skill.xpath('./p[@class="skill-name"]/b/text()')+li_skill.xpath('./p[@class="skill-desc"]/text()')# skill_desc=li_skill.xpath('./p[@class="skill-desc"]/text()')print(skill)
爬虫爬取王者荣耀 英雄故事 和技能相关推荐
- Java爬虫 --- 爬取王者荣耀英雄图片
Java爬虫 - 爬取王者荣耀英雄图片 import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup.nodes.Docu ...
- Python爬虫爬取王者荣耀英雄人物高清图片
Python爬虫爬取王者荣耀英雄人物高清图片 实现效果: 网页分析 从第一个网页中,获取每个英雄头像点击后进入的新网页地址,即a标签的 href 属性值: 划线部分的网址是需要拼接的 在每个英雄的具体 ...
- 爬虫爬取王者荣耀英雄
爬虫爬取王者荣耀英雄 爬取英雄所在标签 得到英雄详情页与图片地址 爬取英雄所在标签 import requests import bs4 from bs4 import BeautifulSoup # ...
- python3APP爬虫--爬取王者荣耀英雄图片(附源码)
文章目录 一.准备工作 1.工具 二.思路 1.整体思路 2.爬虫思路 三.获取数据 1.抓包 2.分析json 四.撰写爬虫 五.得到数据 六.总结 之前有写过抖音app用户信息爬虫,因为当时是第一 ...
- python爬虫——爬取王者荣耀英雄出装建议(一)
爬取装备列表 #爬取王者荣耀装备,并写入MySQL数据库import requests import re import pymysqldb=pymysql.connect('localhost',' ...
- python3APP爬虫--爬取王者荣耀小姐姐cosplay照片(附源码)
文章目录 一.絮叨 1.接上 2.启下 二.代码 三.查看数据 四.总结 一.絮叨 1.接上 自己挖的坑,自己填.上一篇python3APP爬虫–爬取王者荣耀英雄图片(附源码)爬取了王者荣耀英雄图片, ...
- Python爬虫——手把手教你爬取王者荣耀英雄皮肤
大家好!我是霖hero 大家知道目前最火的手游是哪个嘛,没错,就是王者荣耀,这款手游想必大家都听过或者玩过吧,里面有106个英雄,几百个英雄皮肤,今天我来手把手教你们把几百个皮肤都爬取下来. 目录 P ...
- 教你用python爬取王者荣耀英雄皮肤图片,并将图片保存在各自英雄的文件夹中。(附源码)
教你用python爬取王者荣耀英雄皮肤图片,并将图片保存在各自英雄的文件夹中.(附源码) 代码展示: 保存在各自的文件夹中 美么? 让我们开始爬虫之路 开发环境 windows 10 python3. ...
- Python批量爬取王者荣耀英雄高清壁纸
Python批量爬取王者荣耀英雄高清壁纸 文章目录 Python批量爬取王者荣耀英雄高清壁纸 前言 爬虫步骤 python代码实现 总结 前言 很多喜欢玩王者的朋友很希望把王者荣耀的英雄图片拿来做壁纸 ...
最新文章
- HZOJ matrix
- 转载--CentOS 6.3下部署LVS(NAT)+keepalived实现高性能高可用负载均衡
- 2018高中计算机会考知识点,2018高中物理会考知识点总结
- 用Word写博客园文章
- Android 如何添加一种锁屏方式
- go rpc安装方法
- 记录远程桌面登录者的IP和MAC
- PHP RSA2 签名算法
- python运行中更改代码_运行时更改python源代码
- Quantum Machine Learning——QML学习记录00
- C语言学习-翁凯(第三章笔记)
- matlab中进行太阳能电池模型,基于Matlab的光伏发电系统仿真研究
- python如何实现手眼定标_kafka基础和python如何操作kafka
- WSJ Merkel Top On Forbes' Most Powerful Women List For 4th Year
- Linux找回删除文件
- 使用Python扩展库numpy中的piecewise()函数实现分段函数模拟兔子的行走轨迹,然后使用matplotlib.pyplot中的plot函数绘制折线图表示兔子和乌龟的时间位移图,并添加坐标
- 京东云加速扩展“朋友圈” 火力全开大展生态“云”图
- 在 Node.js 中操作 Redis
- nginx 在海思平台移植编译
- compact紧凑算法思想