python爬虫遇到js加密,python爬虫遇到JS加密,pyv8运行js,详细解密过程
首先说一下什么是加密,所谓js加密大多出现在表单提交过程中,下面我将以中国电信为例,详细讲解如何利用pyv8来加密登录的密码。要说明的是pyv8目前仅仅支持python2,用的下伙伴要注意自己的python版本,(当然关于python3的下伙伴,我下一章会讲到,利用pyExecjs来执行JS效果同pyv8一样)
首先我们找到电信的用户登录了解http://login.189.cn/web/login,打开开发者工具,点击network,输入手机号和秘密加上验证码,点击登录,在all这一栏找到login
image.png
可以看到password字段是加密以后的密码,那么是怎么加密的呢?一般加密都是通过js加密那么我们继续往下找发现有一个js文件(jquery.fn-aes.min.js)
image.png
点击以后发现右边的不就是加密方式吗?哈哈哈,找到加密方式,我们离胜利就更近了一步,分析加密过程我们可以看到,加密的key是'login.189.cn',其中的iv是偏移量,找到加密方式如何运行呢?不着急,我们看到CryptoJS这个库了吗?
image.png
分析发现这就是JS加密算法,我的思路是加载CryptoJS然后,用他来加密登录密码,好我们来找到CryptoJS这个的加密JS。
image.png
继续往下看我们能看到aes.min.js(点击进去后发现就是我们上面所需要的JS加密算法),到这里我们基本上就成功了一半,接下来我们只需要加载这个加密算法,运行加密函数,我们输入的明文密码就会加密成密文。我们先下载aes.min.js这个js文件,保存到本地取名为:crawl_.js.
接下来就是我们运用pyv8来执行JS加密的过程,代码如下:
import PyV8
ctxt = PyV8.JSContext()
ctxt.enter()
c = raw_input('请输入验证码:')
add = '''
aesEncrypt = function() {
var t = CryptoJS.MD5("login.189.cn"),
i = CryptoJS.enc.Utf8.parse(t),
r = CryptoJS.enc.Utf8.parse("1234567812345678"),
u = CryptoJS.AES.encrypt('''+"'{}'".format(c)+''',i, {
iv: r
});
return u + ""
};
'''
with open('crawl_.js')as f:
a = f.read()
func = ctxt.eval(a + add)
print func()
运行代码我们输入:123456
加密后的结果为:aeMui9uecQAA8XCQwfpUEA==
如下图:
image.png
image.png
通过对比发现,我们python中运行pyv8加密后的密码和电信网站加密的密码,结果一样,到此整个加密过程结束。。下一章我会讲如何在python3下运用PyExecjs 来解密电信加密。想知道的下伙伴私信我哦。
声明:此文章仅仅作为学习使用,请勿违反法律,尽量放慢你的速度、尽量遵循robots规则。
python爬虫遇到js加密,python爬虫遇到JS加密,pyv8运行js,详细解密过程相关推荐
- Chrome自动运行Js去广告,利用插件网页自动运行Js脚本,油猴去广告教程【去处指定部位的广告】
免自写代码去除广告,点击即可安装:点此去向去除广告的油猴脚本 -------以下是教学如何自己写油猴脚本删除指定广告的------ 目的页面:https://m.dmzj.com/view/33353 ...
- 企业文件加密系统价格—公司文件加密系统多少钱?
企业文件加密系统多少钱?怎么收费?一般是根据需要购买的台数进行收费的. 现在市面上有很多做文件加密系统的厂商,每家收费标准都不一样,在百度搜索文件加密系统的价格,就会发现价格有几百到1000/台的不等 ...
- python爬虫处理js混淆加密_Python爬虫—破解JS加密的Cookie
專 欄 ❈Jerry,Python中文社区专栏作者. blog:https://my.oschina.net/jhao104/blog github:https://github.com/jhao10 ...
- Python爬虫入门之淘宝JS逆向解析请求参数Sign加密(一)
关于JS逆向,相信这是很多小伙伴学习爬虫的一个门槛之一,如果你是初学者入门,开发一款爬虫,要以思路为主,代码是其次的 这里所说的思路指两个方面,一,分析观察目标站点思路,二,代码开发思路,二者缺一不可 ...
- 用python爬虫来登录深信服ac行为控制器,涉及到js加密部分,更新url分类库(针对企业微信更新)
企业环境中会有限制员工访问外网的情况,但是限制外网的同时也会把一些常用的软件也限制掉,比如(企业微信)所以需要把企业微信用到的域名,还有url排除掉,但是企业微信的域名,还有IP是不固定的,需要经常登 ...
- python邮件图片加密_Python爬虫如何应对Cloudflare邮箱加密
最近写一个小爬虫,需要拿到邮箱信息,发现拿不到,也不是ajax接口.最后查资料发现是被Cloudflare加密起来了,有加密肯定有解密. 柠之漠然: 这个解密方式就是从那段 js 代码转换过来的 其中 ...
- QQ音乐JS逆向爬虫,我用python全都爬!
爬虫高级必然JS逆向,QQ音乐爬虫就是一个很好的练手,读完学会了直接在你女朋友面前装一手,读完你将收获到,QQ音乐JS逆向,sign参数获取,songmid参数获取,vkey参数获取,selenium ...
- python爬虫文字加密_Python爬虫进阶必备 | X薯中文网加密分析
此次来分析某个小说网站. aHR0cHM6Ly9nLmhvbmdzaHUuY29tL2NvbnRlbnQvOTM0MTYvMTM4Nzc5MTIuaHRtbA==node 分析请求 先来看看页面的请求 ...
- python 法律检索_Python爬虫进阶必备 | 某裁判文书检索网站加密分析与自动登录实现...
抓包分析 先抓包分析一下登录的请求[图1-1] 图1-1 按照加密的参数,我们一个个分析. 首先是 _csrf ,这个参数比较简单,一般是用来防止跨域***的,感兴趣的朋友可以借助搜索引擎了解一下,不 ...
最新文章
- 8天学通MongoDB——第二天 细说增删查改
- 在Servlet中实现页面转发
- 自媒体运营要知道的哪些知识
- 如何查看tensorflow源代码
- java注册是什么意思_springcloud注册中心是什么意思?有什么作用?
- jdk1.7 1.8新特性
- 第二次作业——Python基础和软件工程
- SSD+caffe︱Single Shot MultiBox Detector 目标检测(一)
- 移动WEB开发之Safari、QQ、UC、360浏览器的私有Meta属性
- Pytorch搭建DenseNet
- 四、瞰景Smart3D创建工程
- LVGL使用华为鸿蒙字体
- 如何将class文件反编译成java文件
- 华为监事会副主席丁耘长跑28公里后突发疾病去世,年仅53岁!
- MATLAB图像处理(包括图像类型转换)----转载
- 解决fidder一直报“The sever(XXX) presented a certificate that did not validate,....”
- (十二)c#Winform自定义控件-分页控件
- 大学物理复习--变化的电磁场
- 小白安装pip及上传get-pip.py代码
- 七夕蛤蟆背后的赚钱逻辑,没想到叫两声:孤寡,就可以日赚 10 万