python爬取皮肤_如何用Python爬取LOL官网全英雄皮肤
你没有看错,没错今天小编带你爬取LOL官网全英雄皮肤的图片
不要失望,也不要难过
接下咱们来讲讲怎么爬取LOL官网
本次案例使用到的模块
import requests
import re
import json
安装模块:
pip install requests
#re、json都是自带的不需要安装
01
获取JS源代码 获取英雄的ID
首先让咱们找到每个英雄皮肤的地址,F12打开开发者工具页面选择器,选中图片自动找寻到图片的地址
龙的传人 李青的图片地址:
http://ossweb-img.qq.com/images/lol/web201310/skin/big64003.jpg
神僧 李青图片地址:
http://ossweb-img.qq.com/images/lol/web201310/skin/big64011.jpg
不难发现其中的规律:
big64003.jpg
big64011.jpg
很明显 64是英雄的ID地址 003是皮肤顺序
找到JS源代码,你会发现英雄的ID地址并不是按照顺序排列下来的!
1 def getLOLImages():
2 url_js = 'http://lol.qq.com/biz/hero/champion.js'
3 #获取JS源代码 str bytrs字节
4 res_js = requests.get(url_js).content
5 #转码
6 html_js = res_js.decode()
7 #正则表达
8 req = '"keys":(.*?),"data"'
9 list_js = re.findall(req,html_js)
10 # str → dict
11 dict_js = json.loads(list_js[0])
12 print(dict_js)
很多不明白这个正则表达式怎么写,这里简单的说明一下:
前面是 “keys”:后面是,“data” 然后我们需要提取的是中间的部分,那么不管它们是啥,我们就是.?* 通配符全部匹配出来。
后面就不详细讲解了,本篇文章最后,小编会带上详细的视频讲解
02
拼接URL地址、获取下载图片的地址
pic_list = []
for key in dict_js:
#print(key)
for i in range(20):
num = str(i)
if len(num) == 1:
hreo_num = "00"+num
elif len(num) == 2:
hreo_num = "0"+num
numstr = key+hreo_num
url = "http://ossweb-img.qq.com/images/lol/web201310/skin/big"+numstr+".jpg"
print(url)
pic_list.append(url)
list_filepath = []
path = "图片保存地址"
#print(dict_js.values())
for name in dict_js.values():
for i in range(20):
file_path = path + name + str(i) + '.jpg'
list_filepath.append(file_path)
#print(list_filepath)
03
下载图片
n = 0
for picurl in pic_list:
res = requests.get(picurl)
n+=1
if res.status_code ==200:
print("正在下载%s"%list_filepath[n])
with open(list_filepath[n],'wb') as f:
f.write(res.content)
详细视频学习地址
链接:https://pan.baidu.com/s/1TbPuMUsKvuk9bqh3hm6wNQ
密码:ewyk
如您对本文有疑问或者有任何想说的,请点击进行留言回复,万千网友为您解惑!
python爬取皮肤_如何用Python爬取LOL官网全英雄皮肤相关推荐
- 如何用Python爬取LOL官网全英雄皮肤
今天小编带你爬取LOL官网全英雄皮肤的图片 不要失望,也不要难过 接下咱们来讲讲怎么爬取LOL官网 本次案例使用到的模块 import requests import re import json 安 ...
- 如何用Python瞬间获取LOL官网全英雄皮肤的图片?
你没有看错 就是爬取LOL官网全英雄皮肤[的图片] 嘿嘿嘿,以为可以有全英雄,全皮肤了? 爬虫实战 用到的模块:requests.re.json 安装:pip isntall requests 首先让 ...
- python爬实时数据_如何用python爬取实时更新的动态数据?
爬虫实时更新 互联网是绝对豪爽的数据源.不幸的是,倘若没有轻易构制的CSV文献可供下载和说明,则绝大部门.倘若要从很众网站拘捕数据,则必要测验举办收集抓取. 倘若您照样一个初学者,请不要忧愁-正在数据 ...
- python爬虫抢火车票_如何用python写一个简单的12306抢票软件|python 爬火车票 教程...
python 如果抓取验证码图片 类似12306的登录验证码图片 这个以前做次.最大的麻烦是码的识别算法的识别率太低.12306那种网站登陆错3次就限制你20分钟.所以除非你有33%以上的识别率否则不 ...
- python 登陆淘宝_如何用 Python 自动登录淘宝并保存登录信息?
原标题:如何用 Python 自动登录淘宝并保存登录信息? 作者 | 猪哥 责编 | 伍杏玲 前段时间时间为大家讲解了如何使用requests库模拟登录淘宝,而今天我们将对该功能进行丰富.所以我们把之 ...
- python 矩阵运算 for循环_如何用 Python 科学计算中的矩阵替代循环
展开全部 因为在Mathematica中使用循环确实是低效的.32313133353236313431303231363533e78988e69d8331333361313961..... 深层次的原 ...
- 用python处理excel表格_如何用python处理excel数据 | 用python处理excel表格数据类型
python 读取EXCEL文件中的数据格式 扩展库 xlrd 读excle xlwt 写excle 直上搜就能下载 下载后使用 import xlrd 就可以读excle了 打开文件: xls = ...
- python 读取excel图片_如何用Python读取Excel中图片?
公众号: 早起Python 作者:刘早起 大家好,在使用Python进行办公自动化操作时,一定少不了与Excel表格的交互,我们通常是用pandas处理表格数据,但大多数情况下,都是读取表格中的数值进 ...
- 怎么用python读取excel图_如何用Python读取Excel中图片?
公众号: 早起Python 作者:刘早起 大家好,在使用Python进行办公自动化操作时,一定少不了与Excel表格的交互,我们通常是用pandas处理表格数据,但大多数情况下,都是读取表格中的数值进 ...
- python搭建自动化测试平台_如何用python语言搭建自动化测试环境
原标题:如何用python语言搭建自动化测试环境 技术分享:基于Python语言的Web自动化测试环境搭建 近期发现很多初学者在学习自动化的过程当中,在环境安装环节总是出现问题,所以详细的出一篇环境搭 ...
最新文章
- python stm32-STM32F4系列使用MicroPython开发
- HQL中出现XXX is not mapped的错误
- why my filter by titleID does not work
- 带有托管代码的InfoPath2007表单模版发布到SharePoint表单库(浏览器方式查看)
- 听说你想爬点壁(mei)纸图
- CDays–5 习题二(利用Python科学计算特性,使用常用计算符)及相关内容解析。...
- Ran 0 tests in 0.000s
- 雅思两次7.5经验分享~希望帮你冲击雅思高分!
- 用过Retina视网膜屏幕的笔记本电脑的后果
- linux cadaver 命令,备份Linux操作系统的数据到坚果云的方法
- IP-guard功能详解——屏幕监控
- 伊朗加油站遭网络攻击致瘫痪、Babuk勒索软件源代码泄露|10月28日全球网络安全热点
- APP全局色彩饱和度修改
- Docker 部署ElasticSearch + Kibana
- 暴雪在洛杉矶建了自己的电竞馆,守望先锋锦标赛下个月就会在这里举行
- 身份证验证接口API(仅需一行代码,公安部实时接口)
- Android adb 安装 apk无法安装错误排查
- 世界顶级的程序员大佬都有谁?
- vivado三人表决仿真
- 地铁售票系统java代码_VHDL 地铁自动售票系统