网站:http://b2b.huangye88.com/

需求:爬取黄页88 网站下的一些公司的详情信息

eg:http://b2b.huangye88.com/gongsi/company561409/detail.html

出现的问题:在解析手机号的时候,遇到数据加密,在页面上看到正常的手机号,在网页源码中为加密字体

获取到网页的源码后,可以看到数据是这样的方式

获取过程不做赘述,相信熟悉一些爬虫的同学应该都清楚,现在说下基础解密方式

不多废话,直接上代码

    def decrypt_phone(encrypt_number):""":param encrypt_number: 加密后的手机号:return:"""code_string = encrypt_number.strip(';')# 替换 &# 为 0,用于后面直接转换为10进制数code_string = code_string.replace("&#", "0")# 转换成列表code_list = code_string.split(';')print(f"code_list:{code_list},{len(code_list)}")# 手机号 >标准手机号形式int_list = Noneif len(code_list) == 11:# 第一个号码为1对应的10进制值c1 = int(code_list[0], base=16)# 创建0-9对应的10进制值int_list = range(c1 - 1, c1 + 9)# 带区号的电话形式elif len(code_list) == 13:# 第一个号码为0对应的10进制值c1 = int(code_list[0], base=16)# 创建0-9对应的10进制值int_list = range(c1, c1 + 10)# 将其转换为hexhex_list = [str(hex(i)) for i in int_list]# 创建0-9的数字对应列表str_list = [str(i) for i in range(0, 10)]# 组装成字典方便对应code_dict = dict(zip(hex_list, str_list))# 把电话号码拼接起来(需要处理带区号的那种电话号码情况)phone = ""for p in code_list:num = code_dict.get(p)if not num:num = '-'phone += numprint(phone)return phoneif __name__ == '__main__':en1 = '												

黄页88网站之加密字符串破解相关推荐

  1. js逆向,破解企名片网站的加密参数

    打开网站–企名片 主要是破解企业数据列表的加密,红框圈起来的 链接:企名片 直接请求网站,response 响应的信息里面没有想要的数据,那应该就是js动态加载的数据,所以直接点击 XHR 你就会看到 ...

  2. 【js逆向】md5加密参数破解

    MD5 md5:消息摘要算法(英文:MD5 Message-Digest Algorithm ),一种被广泛使用的密码散列函数,可以产生一个128位(16字节)的散列值.该加密算法不可逆,通过暴力穷举 ...

  3. 某网站视频加密的wasm略谈(二)

    某网站视频加密的wasm略谈(二) 网页反录制 第一种录制方式 第二种录制方式 网页端加密发展趋势 对于视频的加密: 对于代码的加密: 网页反录制 上一篇主要讲的是解密方向,那么这一篇主要讲的就是加密 ...

  4. 极验第四代滑块验证码破解(四):请求分析及加密参数破解

    极验第四代滑块验证码破解(四):请求分析及加密参数破解 声明 一.极验请求分析 1. 滑块测试网站入口 2. 滑块验证过程抓包 3. 请求详解 3.1. adaptive-captcha-demo 3 ...

  5. python爬虫 request+lxml爬取黄页88网企业信息

    黄页88网: 简称黄页网或者黄页88,是由互联网资深人士创办于2009年11月.是一家整合企业黄页.分类信息以及时下流行的SNS社区三方面优势于一体定位于服务B2B平台的网站.主要帮助企业宣传推广公司 ...

  6. 关于.SMP格式音乐加密文件破解方法的一些尝试

    关于.SMP格式音乐加密文件破解方法的一些尝试 最近老妈在淘宝上买了个自带广场舞音乐的音响,她想让我帮她把里面的音乐拷出来放手机上听,却发现里面的音乐格式都是.smp的加密文件,闲着也是闲着,就做了些 ...

  7. Rar加密文件破解案例

    Rar加密文件破解案例 Simeon 本文已投51cto网站 通过本案例可以学习到: (1)了解破解rar加密文件方面的相关知识 (2)使用工具软件Advanced RAR Password Reco ...

  8. python图片压缩pako_vue中使用 pako.js 解密 gzip加密字符串的方法

    前言 今天跟后台对接一个接口,接受到一个加密的值,说是通过gzip加密过的,然后就蒙蔽了, 赶紧上百度找了一下资料,通过一篇文章(原文在底部)发现有个js库可以解密,就下载轻松解密了 实现代码 pok ...

  9. 2019年末逆向复习系列之百度指数Data加密逆向破解

    郑重声明:本项目的所有代码和相关文章, 仅用于经验技术交流分享,禁止将相关技术应用到不正当途径,因为滥用技术产生的风险与本人无关. 这篇文章是公众号<云爬虫技术研究笔记>的<2019 ...

最新文章

  1. iptables+geoip来过滤阻挡来源IP
  2. 基于Elasticsearch实现搜索建议
  3. 93. 复原 IP 地址(回溯算法)
  4. 【直播课】6小时教你熟知Anchor free理论基础,掌握项目实战技巧
  5. 【GAN模型结构】从最简单的全卷积GAN一起开始玩转GAN
  6. 蓝桥杯评测_前n项和
  7. ionic轮播,滑动之后不进行轮播
  8. PHP操作Memcache基本函数的方法
  9. 0 full gc时cpu idle_结合GC日志讲讲CMS垃圾收集器
  10. ExecuteNonQuery(),ExecuteScalar(),ExecuteReader的相关用法
  11. Artstudio Pro for mac(绘图和编辑工具)
  12. spring系统学习之控制反转 ioc
  13. 使用YYLabel匹配连接
  14. Vulkan【1】介绍
  15. 我弟今年高考,报的志愿是电子信息,到现在录取的是计算机科学与技术,哪个专业更好一些,2021年电子信息科学与技术专业大学排名及分数线【统计表】...
  16. 帝国cms e loop php,帝国CMS灵动标签e:loop的使用 标签循环
  17. 阿里云IoT2018年度十佳合作伙伴20强入围企业公布...
  18. python判断语句的使用
  19. 什么是MDD,DDD,TDD?
  20. B2B、B2C、C2C、O2O区别

热门文章

  1. 微电子和计算机的职业生涯规划访谈
  2. 图书馆共享计算机,图书馆资源共享中计算机网络技术的使用
  3. BSP -- 图书共享系统(Book Sharing Platform)
  4. HTG评论Amped无线TAP-EX Wi-Fi扩展器:2.4Ghz频段的强大功能
  5. English Proverbs
  6. 伊隆 马斯克经典语录英文_为什么伊隆麝香Neuroink将改变人类的未来
  7. 详解Python正则表达式(含丰富案例)
  8. brew php 降级icu4c
  9. vmware虚拟机三种网卡
  10. es 查询一次性只返回10条数据的解决办法