python破解email-protected(爬虫那点事)

部分网站采用了百度CDN的邮箱加密技术,情况如下:



像这种情况便需要解密,全局搜索email-protection,发现解密js文件为email-decode.min.js,代码逻辑大致如下:

  • href属性#后内容和“data-cfemail”值都可以用以解密,可以随便用一个
  • 先将字符串前两个字符从十六进制转换为十进制,作为key
  • 之后将剩下的字符两两转为十进制,并与key异或,异或结果为十进制数,转为单个字符
  • 所有字符拼接在一起即为解密后的信息

python代码如下:

# t1 = "87ecebe6f2f4a9e6ecf3e8f5eee2f4c7f7efe6f5eae6ece8eba9f2e9eeaae1f5e2eee5f2f5e0a9e3e2"
t1 = "6a01060b1f19440b011e0518030f192a1a020b18070b010506441f0403470c180f03081f180d440e0f"# 十六进制转十进制
def ox2dec(ox:str):return int(ox,16)def decode(to_decode:str):decode = []key = ox2dec(to_decode[:2]) # 前两位为密钥data = []for i in range(2,len(to_decode),2):to_decode_i = ox2dec(to_decode[i:i+2])# print(to_decode_i,key)decode_i = to_decode_i^key # 十进制异或会先转二进制异或,结果再转回十进制decode.append(chr(decode_i)) # 十进制数转字符return "".join(decode)print(decode(t1))

最后,请合理合法爬取!

python破解email-protected(爬虫那点事)相关推荐

  1. python破解网易反爬虫机制

    用python3 urllib破解有道翻译反爬虫机制 前言 最近在学习python 爬虫方面的知识,网上有一博客专栏专门写爬虫方面的,看到用urllib请求有道翻译接口获取翻译结果.发现接口变化很大, ...

  2. 如何利用 C# + Python 破解猫眼电影的反爬虫机制?

    在 如何利用 C# 爬取「猫眼电影:最受期待榜」及对应影片信息! 这篇图文中可以看到猫眼电影对"本月新增想看人数" 和 "总想看人数"进行了字符集加密. 在 如 ...

  3. python爬虫案例——糗事百科数据采集

    全栈工程师开发手册 (作者:栾鹏) python教程全解 python爬虫案例--糗事百科数据采集 通过python实现糗事百科页面的内容采集是相对来说比较容易的,因为糗事百科不需要登陆,不需要coo ...

  4. python最简单的爬虫代码,python小实例一简单爬虫

    python新手求助 关于爬虫的简单例子 #coding=utf-8from bs4 import BeautifulSoupwith open('', 'r') as file: fcontent ...

  5. Python破解滑块验证码算法,完美避开人机识别

    | 完美是不可能的,加个震惊!Python破解BiliBili滑块验证码,完美避开人机识别,可以有 准备工作 B站登录页 https://passport.bilibili.com/login pyt ...

  6. 【Python笔记】网络爬虫——常用框架介绍以及 Scrapy 框架使用

    网络爬虫开发常用框架 Scrapy 爬虫框架 Crawley 爬虫框架 PySpider 爬虫框架 Scrapy 爬虫框架的使用 搭建 Scrapy 爬虫框架 1. 安装 Twisted 模块 2. ...

  7. python官网学习爬虫资料_Python爬虫学习?

    1 爬虫是互联网上最常见的一种东西了吧. 爬虫这东西每天都在网上爬大量的信息,各大搜索引擎厂商每天都有上百万的爬虫在网络上活动,这些爬虫的作用就是给搜索引擎采集互联网上最新的内容,采集来的内容经过分类 ...

  8. Python学习三: 爬虫高级技巧 与 模拟实战练习

    三大爬虫技巧 许多网站针对爬虫的访问都设置了一定的障碍,通过这三步技巧,轻松绕过部分的反爬虫限制. (1)设置程序休止时间 import time import random# 休止睡眠 1 秒 这里 ...

  9. python多线程破解压缩包_我用 Python 破解了同事的加密压缩包!

    原标题:我用 Python 破解了同事的加密压缩包! 作者 | 朱小五 又是一杯奶茶. 事情的经过是这样的: 又是奶茶,行吧行吧. 快点开工,争取李大伟回来之前搞定. 李大伟说是6位数字密码 那么我们 ...

最新文章

  1. ASP.NET MVC Html.ActionLink使用说明
  2. oel6mysql_Linux7(CentOS,RHEL,OEL)和 Oracle RAC环境系列4:target(图形
  3. Netflix是这样炼成的:谁构建,谁运维
  4. DotNET企业架构应用实践-企业管理软件架构的历史与发展(中)- 分布式系统
  5. Python-OpenCV 笔记1 -- 图像与视频的读取、显示、保存
  6. 分酒问题matlab代码,matlab葡萄酒分类数据归一化问题
  7. 仓库的种类和彼此关系
  8. WEKA The workbench for machine learning
  9. 微课|《Python编程基础与案例集锦(中学版)》第4章例题讲解(3)
  10. Intel安装框架爆出带本地提权的任意代码执行漏洞CVE-2017-5688
  11. 解决redis 配置文件设置密码不生效的问题
  12. 跨境电商亚马逊产品运营模式都有哪些
  13. 【EasyUse】一键式检索框-界面美化参考。MFC自绘对话框加图和Button
  14. O2O商业模式目前的状态需看透什么?未来会呈现怎样的特征?
  15. 比较motif和一条长序列的相似性
  16. 处理ArchLinux上各软件屏幕卡顿与显示问题(chrome浏览器,微信开发者工具wxdt,vscode移动慢问题)
  17. 前端js实现文字自动转拼音方法
  18. 生信自学笔记(九)智慧的长者与多序列联配之clustal全局联配算法
  19. Eric靶机渗透测试通关全教程
  20. 外媒:欧盟推出超级计算机 计划追赶中国

热门文章

  1. labview 各版本及其模块工具下载汇总
  2. Python tkinter -- 第14章 列表框(Listbox)属性
  3. html5 js(Javascript-Barcode-Reader)实现上传图片或拍照识别条形码的功能
  4. html video 加广告,视频加入广告,如何在视频中插入一段广告视频,视频加广告的方法...
  5. SER 语音情感识别-论文笔记4
  6. 手机自带html怎么卸载,怎么删除智能手机系统里自带的软件
  7. ROS1 LTS版本安装教程
  8. 敏捷开发与中医理论系列之二:古法教学(软件教育,松结对编程,师徒制度)
  9. LDA主题模型评价指标汇总
  10. 服务器pe启动不了系统,云服务器PE启动