手动爬取炉石传说所有卡牌
笔者还记得是从大学开始的时候玩的炉石传说,还记得当时的版本只有黑石山,纳克萨玛斯,地精大战侏儒这些卡包,转眼间到了现在,炉石传说早已和之前的那个炉石传说不再一样了,还记得以前的卡牌套路冰法,奴隶战,机械法等等,到现在一系列稀奇八怪的打法,什么偶数萨,天启骑,战吼萨,群星德,青玉德等等.......
这个游戏的变化太大了,感觉真的追不动了,于是,小编准备弃坑了,不去玩炉石了,再此之前,为了纪念一下我那逝去的炉石青春,就把它的所有卡牌都整理出来吧!
首先,我们先找到卡牌的网址:
http://cha.17173.com/hs/
接下来我们要采取爬虫的方式来获取卡牌了,由于网址是异步加载的,所以我们采用selenium来自动爬取网页上的内容。
下面我们要先找打页面上所有卡牌的特征,之后采用正则去匹配卡牌的图片:
所有的卡牌的是img标签里面的,所以我们可以大胆地写正则了:
"window.open($(this).attr('href'));return false;" target=""><img src="(.*?)"
咋一看看起来写的太长了,感觉不好,那就适当的再修改一下:
e;" target=""><img src="(.*?)"
这样就不错了
()里面使我们需要匹配的内容。
由于时间关系,我就直接贴代码了,注释都在代码里:
def get_html(): browser = webdriver.Chrome(r'C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe') browser.get('http://cha.17173.com/hs/') for i in range(90): browser.execute_script('var q=document.documentElement.scrollTop='+str(i*1000)) time.sleep(1) time.sleep(1) html = browser.page_source.encode('GBK', 'ignore').decode('GBk') browser.close()return html def get_imgs(html): img_urls = re.findall('e;" target=""><img src="(.*?)"', html)for img_url in img_urls: img_url = img_url.split('?')[0] img_content = requests.get(img_url).contentwith open(img_url.split('/')[-1],'wb') as f: f.write(img_content) if __name__ == '__main__': html = get_html() get_imgs(html)
大概的结果就是这样了。
喜欢炉石的朋友可以去试试吧!
“SCAN IT”
手动爬取炉石传说所有卡牌相关推荐
- 用Python爬虫爬取炉石原画卡牌图片
前段时间看了点Python的语法以及制作爬虫常用的类库,于是动手制作了一个爬虫尝试爬取一些炉石原画图片.本文仅记录对特定目标网站的分析过程和爬虫代码的编写过程.代码功能很局限,无通用性,仅作为一个一般 ...
- 我用python玩炉石传说(2)-----炉石卡牌套牌爬取器及自动分析卡牌相关度
本文共三个部分: 1,我用python玩炉石传说(1)-----炉石卡牌相关度分析的手动打分器 2,我用python玩炉石传说(2)-----炉石卡牌套牌爬取器及自动分析卡牌相关度 3,我用pytho ...
- 如何用Unity Shader制作类似《炉石传说》卡牌的动态效果?
此篇为鄙人在卡牌项目中,尝试模仿<炉石传说>卡面特效所制作的特效Shader总结回顾,几经修改,最终成为了现在的样子,因为使用简单,效果明显,虽然距离<炉石传说>的卡面特效还有 ...
- unity开发炉石传说系列卡牌生成代码部分代码
using UnityEngine; using System.Collections; using System.Collections.Generic;//生成卡牌 public class ge ...
- 《炉石传说》卡牌描述中的那些梗,这脑洞突破天际!
每次新版本的卡牌描述一直都是大家所津津乐道的,无论中英文都是十分热衷于玩各种梗.就带大家一起来看一下女巫森林新卡描述都用了哪些有趣的梗. 一天一苹果,狼人远离我."一天一苹果,医生远离我&q ...
- 我用python玩炉石传说(1)-----炉石卡牌相关度分析的手动打分器
本文共三个部分: 1,我用python玩炉石传说(1)-----炉石卡牌相关度分析的手动打分器 2,我用python玩炉石传说(2)-----炉石卡牌套牌爬取器及自动分析卡牌相关度 3,我用pytho ...
- Python爬虫实战:炉石传说卡牌、原画数据抓取
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 原画爬取 先看一下炉石传说的原画: 炉石传说原画链接: http://news. ...
- 利用浏览器缓存抓取网络资源:【炉石传说】所有卡牌png图片地址
有的时候我们在网络上看到很好的资源,想要抓取,却苦于没有好的手段.今天我就来介绍一下通过chrome浏览器缓存抓取的方法. 大家都知道,浏览器把网页展示给我们看的时候,会先将页面上的所有图片等资源下载 ...
- 我用python玩炉石传说(3)-----炉石卡牌套牌自动构建算法
本文共三个部分: 我用python玩炉石传说(1)-----炉石卡牌相关度分析的手动打分器 我用python玩炉石传说(2)-----炉石卡牌套牌爬取器及自动分析卡牌相关度 我用python玩炉石传说 ...
最新文章
- python怎么使用训练好的模型设计_tensorflow训练好的模型怎么调用?
- 详解@Builder用法
- 解决layui前端动态设置radio、checkbox默认选项的解决方案
- GitHub标星2.6万!Python算法新手入门大全
- [AHOI2008] 紧急集合
- SharpDeveloeper开发ASP.NET MVC汗流浃背
- freemarker ftl模板_效率提升百分之四十,AS模板也太好用了吧
- 孙鑫-MFC笔记三--绘图
- Oracle 数据库,远程访问 ora-12541:TNS:无监听程序
- 问题解决:AttributeError: 'module' object has no attribute '_rebuild_tensor_v2'
- CocosCreator 框架设计
- VB功能模块:最全的VB操作网页功能模块
- 使用 nosqlBooster for mongoDB 连接 Mongodb
- [windows]win10家庭版切换到管理员账户
- 基于opencv-python的人脸识别、眼睛识别和微笑识别
- html设置文本颜色三种写法,html字体颜色设置方法
- html怎么设置加qq,qq密友 怎么把QQ好友加为密友啊?
- 机器学习中对数据集进行拆分及模型训练
- [转载]Michael Peng:北美求职记
- PPT制作三大技巧:图标 、图片背景透明和自动函数