你没有看错,没错今天小编带你爬取LOL官网全英雄皮肤的图片

不要失望,也不要难过

接下咱们来讲讲怎么爬取LOL官网

本次案例使用到的模块

import requests

import re

import json

安装模块:

pip install requests

#re、json都是自带的不需要安装

01

获取JS源代码  获取英雄的ID

首先让咱们找到每个英雄皮肤的地址,F12打开开发者工具页面选择器,选中图片自动找寻到图片的地址

龙的传人 李青的图片地址:

http://ossweb-img.qq.com/images/lol/web201310/skin/big64003.jpg

神僧 李青图片地址:

http://ossweb-img.qq.com/images/lol/web201310/skin/big64011.jpg

不难发现其中的规律:

big64003.jpg

big64011.jpg

很明显 64是英雄的ID地址 003是皮肤顺序

找到JS源代码,你会发现英雄的ID地址并不是按照顺序排列下来的!

1 def getLOLImages():

2 url_js = 'http://lol.qq.com/biz/hero/champion.js'

3 #获取JS源代码 str bytrs字节

4 res_js = requests.get(url_js).content

5 #转码

6 html_js = res_js.decode()

7 #正则表达

8 req = '"keys":(.*?),"data"'

9 list_js = re.findall(req,html_js)

10 # str → dict

11 dict_js = json.loads(list_js[0])

12 print(dict_js)

很多不明白这个正则表达式怎么写,这里简单的说明一下:

前面是 “keys”:后面是,“data” 然后我们需要提取的是中间的部分,那么不管它们是啥,我们就是.?* 通配符全部匹配出来。

后面就不详细讲解了,本篇文章最后,小编会带上详细的视频讲解

02

拼接URL地址、获取下载图片的地址

pic_list = []

for key in dict_js:

#print(key)

for i in range(20):

num = str(i)

if len(num) == 1:

hreo_num = "00"+num

elif len(num) == 2:

hreo_num = "0"+num

numstr = key+hreo_num

url = "http://ossweb-img.qq.com/images/lol/web201310/skin/big"+numstr+".jpg"

print(url)

pic_list.append(url)

list_filepath = []

path = "图片保存地址"

#print(dict_js.values())

for name in dict_js.values():

for i in range(20):

file_path = path + name + str(i) + '.jpg'

list_filepath.append(file_path)

#print(list_filepath)

03

下载图片

n = 0

for picurl in pic_list:

res = requests.get(picurl)

n+=1

if res.status_code ==200:

print("正在下载%s"%list_filepath[n])

with open(list_filepath[n],'wb') as f:

f.write(res.content)

详细视频学习地址

链接:https://pan.baidu.com/s/1TbPuMUsKvuk9bqh3hm6wNQ

密码:ewyk

如您对本文有疑问或者有任何想说的,请点击进行留言回复,万千网友为您解惑!

python爬取皮肤_如何用Python爬取LOL官网全英雄皮肤相关推荐

  1. 如何用Python爬取LOL官网全英雄皮肤

    今天小编带你爬取LOL官网全英雄皮肤的图片 不要失望,也不要难过 接下咱们来讲讲怎么爬取LOL官网 本次案例使用到的模块 import requests import re import json 安 ...

  2. 如何用Python瞬间获取LOL官网全英雄皮肤的图片?

    你没有看错 就是爬取LOL官网全英雄皮肤[的图片] 嘿嘿嘿,以为可以有全英雄,全皮肤了? 爬虫实战 用到的模块:requests.re.json 安装:pip isntall requests 首先让 ...

  3. python爬实时数据_如何用python爬取实时更新的动态数据?

    爬虫实时更新 互联网是绝对豪爽的数据源.不幸的是,倘若没有轻易构制的CSV文献可供下载和说明,则绝大部门.倘若要从很众网站拘捕数据,则必要测验举办收集抓取. 倘若您照样一个初学者,请不要忧愁-正在数据 ...

  4. python爬虫抢火车票_如何用python写一个简单的12306抢票软件|python 爬火车票 教程...

    python 如果抓取验证码图片 类似12306的登录验证码图片 这个以前做次.最大的麻烦是码的识别算法的识别率太低.12306那种网站登陆错3次就限制你20分钟.所以除非你有33%以上的识别率否则不 ...

  5. python 登陆淘宝_如何用 Python 自动登录淘宝并保存登录信息?

    原标题:如何用 Python 自动登录淘宝并保存登录信息? 作者 | 猪哥 责编 | 伍杏玲 前段时间时间为大家讲解了如何使用requests库模拟登录淘宝,而今天我们将对该功能进行丰富.所以我们把之 ...

  6. python 矩阵运算 for循环_如何用 Python 科学计算中的矩阵替代循环

    展开全部 因为在Mathematica中使用循环确实是低效的.32313133353236313431303231363533e78988e69d8331333361313961..... 深层次的原 ...

  7. 用python处理excel表格_如何用python处理excel数据 | 用python处理excel表格数据类型

    python 读取EXCEL文件中的数据格式 扩展库 xlrd 读excle xlwt 写excle 直上搜就能下载 下载后使用 import xlrd 就可以读excle了 打开文件: xls = ...

  8. python 读取excel图片_如何用Python读取Excel中图片?

    公众号: 早起Python 作者:刘早起 大家好,在使用Python进行办公自动化操作时,一定少不了与Excel表格的交互,我们通常是用pandas处理表格数据,但大多数情况下,都是读取表格中的数值进 ...

  9. 怎么用python读取excel图_如何用Python读取Excel中图片?

    公众号: 早起Python 作者:刘早起 大家好,在使用Python进行办公自动化操作时,一定少不了与Excel表格的交互,我们通常是用pandas处理表格数据,但大多数情况下,都是读取表格中的数值进 ...

  10. python搭建自动化测试平台_如何用python语言搭建自动化测试环境

    原标题:如何用python语言搭建自动化测试环境 技术分享:基于Python语言的Web自动化测试环境搭建 近期发现很多初学者在学习自动化的过程当中,在环境安装环节总是出现问题,所以详细的出一篇环境搭 ...

最新文章

  1. python stm32-STM32F4系列使用MicroPython开发
  2. HQL中出现XXX is not mapped的错误
  3. why my filter by titleID does not work
  4. 带有托管代码的InfoPath2007表单模版发布到SharePoint表单库(浏览器方式查看)
  5. 听说你想爬点壁(mei)纸图
  6. CDays–5 习题二(利用Python科学计算特性,使用常用计算符)及相关内容解析。...
  7. Ran 0 tests in 0.000s
  8. 雅思两次7.5经验分享~希望帮你冲击雅思高分!
  9. 用过Retina视网膜屏幕的笔记本电脑的后果
  10. linux cadaver 命令,备份Linux操作系统的数据到坚果云的方法
  11. IP-guard功能详解——屏幕监控
  12. 伊朗加油站遭网络攻击致瘫痪、Babuk勒索软件源代码泄露|10月28日全球网络安全热点
  13. APP全局色彩饱和度修改
  14. Docker 部署ElasticSearch + Kibana
  15. 暴雪在洛杉矶建了自己的电竞馆,守望先锋锦标赛下个月就会在这里举行
  16. 身份证验证接口API(仅需一行代码,公安部实时接口)
  17. Android adb 安装 apk无法安装错误排查
  18. 世界顶级的程序员大佬都有谁?
  19. vivado三人表决仿真
  20. 地铁售票系统java代码_VHDL 地铁自动售票系统

热门文章

  1. 计算机硬盘找不到,电脑找不到硬盘怎么办
  2. Codeforces 437B 437C
  3. 2020年携程校招开发方向第二题
  4. 含蓄的告别,google今日LOG
  5. QQ列表的收缩展开,带动画效果
  6. 前端学习总结(九)MongoDB——最出色的文档型数据库
  7. 商业虚拟专用网络技术二通用路由封装
  8. 7-12 特立独行的幸福 (25 分)(如何判断特立独行)
  9. Shell脚本介绍(资源)
  10. 软件测试中报表测试用例设计方法总结