python爬虫源码_Python—爬虫:王者荣耀全套皮肤【附源码】
怎么获取全套皮肤?用钱买,或者用爬虫爬取下来~虽然后者不能穿。这个案例稍微复杂一点,但是一个非常值得学习的项目。
具体实现思路:
- 分析网页源代码结构
- 找到合适的入口
- 穷举访问并解析
- 爬取所有英雄所有皮肤图片
代码思路/程序流程:
我分析王者荣耀网站上面的英雄资料库发现所有英雄的页面基本上都是连贯的,并且还是偏向与静态网页没有过多的JavaScript渲染,所以比较适合来一波穷举遍历爬虫,但是速度也很快。
利用python语法字符串操作,列表操作,字典操作等等循环遍历英雄页面利用python列表切片索引和字符串拼接等等方法来解析HTML得到皮肤图片链接和背景故事文本,将皮肤图片二进制文件保存为png高清大图,将所有英雄背景故事合并保存为文本文档
下面是功能以及效果展示
整体展示
爬取效果展示-丰功伟绩
王者荣耀【皮肤高清大图爬虫】源代码如下
#!/usr/bin/env python
# -*- encoding: utf-8 -*-import requests
fo = open('./wzry-jpg/wzry-pf.txt', 'w')path = './wzry-jpg/'
ls = []
for i in range(105,200):url = "http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/{0}/{0}-bigskin-1.jpg".format(i)status_code = requests.request('get', url).status_codeif status_code != 200:continuefor j in range(1, 9):imgurl = url[:-5] + '{}.jpg'.format(j)response = requests.request('get', imgurl)if response.status_code != 200: continuels.append(imgurl)##下载print("开始下载第{}-{}个英雄皮肤图片>>>".format(i,j), end='')with open(path+str(i)+'-'+str(j)+'.png', 'wb') as f:f.write(response.content)print('======下载完成======')for i in range(501,516):url = "http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/{0}/{0}-bigskin-1.jpg".format(i)status_code = requests.request('get', url).status_codeif status_code != 200:continuefor j in range(1, 9):imgurl = url[:-5] + '{}.jpg'.format(j)response = requests.request('get', imgurl)if response.status_code != 200: continuels.append(imgurl)##下载print("开始下载第{}-{}个英雄皮肤图片>>>".format(i,j), end='')with open(path+str(i)+'-'+str(j)+'.png', 'wb') as f:f.write(response.content)print('======下载完成======')
##print(ls)##连接写入txt文件
for line in ls:fo.write(line+'n')
fo.close()
python爬虫源码_Python—爬虫:王者荣耀全套皮肤【附源码】相关推荐
- python 开发视频播放网站_python开发微电影视频网站教程附源码
做为一个合格的Pythoner,只掌握一个框架是不够,如果你有过其它Python框架(例如django)的使用经验,对比不同框架的特性来学习,你将收获更多 当前信息若含有黄赌毒等违法违规不良内容,请点 ...
- Python爬虫教程:爬取王者荣耀全套皮肤【附源码】
怎么获取全套皮肤?用钱买,或者用爬虫爬取下来~虽然后者不能穿.这个案例稍微复杂一点,但是一个非常值得学习的项目. 具体实现思路: 分析网页源代码结构 找到合适的入口 穷举访问并解析 爬取所有英雄所有皮 ...
- Python爬虫实战之王者荣耀全套皮肤采集~
导语: 哈喽吖!铁汁们.王者荣耀这款手游,想必大家都玩过或听过,虽已运营7年,但热度依然不减当年,各种英雄配上各式各样的皮肤,甚是精美, 今天就教大家如何利用几行Python代码爬取王者荣耀全套皮肤~ ...
- Python爬虫——王者荣耀全皮肤拉取
文章目录 Python爬虫--王者荣耀全皮肤拉取 资源地址 HeroScrapy.py 运行上面的代码即可 注意点 Python爬虫--王者荣耀全皮肤拉取 开门见山,话不多说 资源地址 英雄信息列表: ...
- python爬取豆瓣读书top250并保存xls(含源码)
python爬取豆瓣读书top250并保存xls(含源码) 又是霍霍豆瓣的一天O(∩_∩)O哈哈~. 目标网站:http://book.douban.com/top250/ 全军出击!!! 首先,按下 ...
- python3网络爬虫--爬取b站用户投稿视频信息(附源码)
文章目录 一.准备工作 1.工具 二.思路 1.整体思路 2.爬虫思路 三.分析网页 1.分析数据加载方式 2.分词接口url 3.分析用户名(mid) 四.撰写爬虫 五.得到数据 六.总结 上次写了 ...
- 最新云开发王者荣耀查询小程序源码
正文: 最新云开发王者荣耀查询小程序源码,是最近刚出来的,无需数据库,无需服务器即可搭建,因为是云开发的,程序仅几百KB而已. 下载方式: lanzou.com/iBfac029a3di
- 使用python多线程获取代理IP(代理IP池,附源码)
@[TOC]使用python多线程获取代理IP(代理IP池,附源码) 代理IP池 都说现在是大数据的时代,大多数的厂商会特别的注重自己家的数据安全问题,但同时,也有着许多的行业是需要大数据来做支撑的, ...
- 曝肝三天,两千行Python代码,制作B站视频下载工具(附源码)
曝肝三天,两千行Python代码,制作B站视频下载工具(附源码) 文章目录 一.准备工作 二.预览 1.启动 2.解析 3.下载中 4.下载完成 5.结果 三.设计流程 1.bilibili_vide ...
最新文章
- 协方差矩阵有什么意义?
- JZOJ 3.10 1540——岛屿
- 笔记-企业管理知识-战略组织类型
- DOM获取元素位置的三大系列offset/scroll/client
- 通过system调用Am命令执行动作
- LeetCode 923. 三数之和的多种可能(双指针)
- php内核探索 [转]
- python安装完毕后,用pip安装,提示找不到ssl模块
- mysql独立开发_nacos的mysql独立部署
- PO/VO/BO等对象模型
- linux recv返回值,Nginx 的recv() failed 错误解决一例
- FL Studio下载2020水果软件注册机音频剪辑功能讲解教程
- (Arxiv-2021)掩码自编码器是可扩展的视觉学习者
- matlab 音乐 豆腐汤,40岁健康家常菜pdf
- django -数据库操作
- 习题4-1 Xiangqi UVA - 1589
- 《普陀区加快发展网络安全产业实施意见》的通知
- 采集微信公众号数据的思路
- 京东商城空调标价0元引发抢购
- 福昕pdf阅读器的划词翻译功能如何添加(图文并茂)