有网友说我之前写的 大众点评字体解密 的方法已经失效了,所以更新一篇解密 2019年7月25日。

查看加密

看到都是小框框,为了一探究竟我们查看源码找到加密处

所有文字都是 > 这样的怪符号。一脸懵逼,这和之前点评网站的字体反爬完全不同了。

查看页面代码


经过一番查找, 发现了两个个至关重要的信息

  1. 关键 CSS 文件, 里边包含了字体文件,用于通过神秘代码映射出真正文字。
  2. 加密处标签 clss='address' 这里的class值就是,使用的哪个指定的字体库。

打开 CSS


里边就有字体文件 .woff 我们下载这个字体文件

打开 woff 文件

这里我们利用工具 http://fontstore.baidu.com/static/editor/index.html

打开字库文件

经过对比发现,可以通过页面上加密的神秘代码和字体库中红色方框中代码进行匹配

用 python 获取 woff 的内容

pip3 install fontTools

这个库可以将 woff 文件转换为 xml 文件,并读取

from fontTools.ttLib import TTFontfont = TTFont('字库.woff')
font.saveXML('test.xml')  # 将 woff 写为 xml 文件从而就可以对 xml 文件进行操作了

Redis Hash 储存字库

美团这套字体库是会随机更新的,所以我们需要写一套通用代码出来自动匹配!

解决方案:

我做了一套 Redis Hash储存,将字库同步到redis中,如果出现新字库就会自动提取到redis中, 如果字库是旧的,那么直接从旧字库取出对应值。

hash 的 key 为字库名, 值为字库映射表

毫秒级响应超快速度将加密的神秘代码转换为正常字符

调用案例

  1. 在实例化对象的时候配置 redis (默认已经配置的本机redis)
  2. 填入数据页面中 含有字体链接的css文件路径
  3. 调用解析神秘代码即可



Demo代码

欢迎 Star 与关注,会不断更新其他站点的解密、教程等

GitHub代码
如果需要批量页面解析的话,需要将class 值与字库对应起来

大众点评最新字体解密19年7月相关推荐

  1. python大众点评最新字体加密破解完结

    直接上结果吧,具体的破解过程和代码看文末链接: 全部教程地址:https://mp.weixin.qq.com/s/XdYK8Y5W8b5H-aDRJEvy3Q 或者关注公众号:[PyDream]

  2. 大众点评字体_大众点评美食——字体字典生成(二)

    紧接上篇介绍了字体加密中字体文件和页面源码中的对应关系,要获取数据 你还需要一份字典! pycharm一开 一顿操作猛如虎 一.获取页面源码 并提取css的链接 二.下载其中的四个类型标签对应的wof ...

  3. 大众点评app 数据解密和反序列化

    在使用charles 抓大众点评app数据包的时候会发现,请求接口是没有加密的. 但是抓到的数据 全都是乱码,这其实是点评使用了加密算法,所以就需要对应的解密算法. 数据解析操作需要先解压缩,然后再解 ...

  4. 终于解决大众点评的字体反爬了!

    为了防止自己忘了,还是在这里写个大概过程吧 还不完善,之后再改 之前虽然我接触过一个字体反爬的网站,但是比较简单的,字体文件直接就在源码里,大众点评的不一样,我们先去网页看一下,可以发现,评价数,人均 ...

  5. python爬取大众点评字体_python爬取大众点评解决字体反爬

    今天我们弄一下大众点评 学习阶段,我们要抱着学习的目的 重点是思路,做爬虫就不要想着一劳永逸了 方法公开,人家就换了 知识是你自己的,学到了,他换不掉 好了,我们开始吧 网站展示 https://ww ...

  6. 反反爬虫 大众点评-图片文字破解 2020年6月6日更新

    非常关键的一步(没这步就会显示乱码) 直接爬取(错误爬取页面) 当你直接在店铺页面爬取时 在F12选取元素后会发现html文件里面的字是乱码字 正确的爬取页面 进入商家页面的review_all页面, ...

  7. 爬取大众点评评论-字体加密解析!这个网站很难搞出来!

    获取页面数据 首先写一个简单的爬虫, 来获取页面数据 class DaZhongDianPing:def __init__(self):self.s = requests.session()self. ...

  8. 大众点评数据信息获取——字体反爬

    大众点评数据信息获取--字体反爬 大众点评的字体反爬算是比较常见的,这次来学习一下相关字体反爬的技巧 以店铺的评论页面和店铺列表页面进行研究,分别对应了css字体映射,woff字体加密的反爬虫手段. ...

  9. Python探秘大众点评北京火锅店第①期:好吃的火锅在哪里?

    文章目录 1. 说明 2. 北京火锅店基础数据 2.1. 火锅分类 2.2. 各地区火锅分类 2.3. 各地区火锅店数量 3. 北京火锅店评分数据 3.1. 评分直方图 3.2. 各地区商家评分箱线图 ...

最新文章

  1. 链表问题3——删除链表的中间节点(初阶)
  2. 【Java面试题】3 Java中使用final关键字修饰一个变量时,是引用不能变,还是引用的对象不能变?超详细解析...
  3. laravel 5.1 Model 属性详解
  4. nyoj99(欧拉路)
  5. Linux系统安全工具tcpdump用法
  6. svnsync实现版本库的同步备份
  7. Linux 下压缩与解压.zip 和 .rar
  8. C++算法五:二分查找(折半)查找
  9. 基于机器视觉的细小金属件表面污渍检测
  10. java 路由器接口的作用是什么_路由器的接口和用途
  11. Maven项目中,jar包版本冲突导致运行时报错的问题
  12. Hibernate 主键
  13. informix数据库unload下载数据和load上传数据
  14. BUMO 3.0原理以及设计.
  15. win10鼠标停留任务栏不显示预览小窗口
  16. Matlab 校验方法
  17. Laravel:whereIn子查询
  18. 学生一族必备热门手机应用软件大汇集
  19. 文件编码与文件的读写与0x0D0A
  20. 操作系统 - - 生产者—消费者问题(PV操作)代码显示

热门文章

  1. 计算机组装静电的危害,浅谈组装电脑如何防静电与去除机箱静电的方法-DIY装机...
  2. 史上最全的PDF编辑工具(编辑,转换,合并),持续更新!
  3. 专享策略02 | 套利策略-自动换仓-出场加速
  4. 此电脑中移动了下载、音乐、文档等文件夹的位置后如何还原?
  5. unity3d-射线
  6. python之字符ASCII码的幸运数字~clash of coding
  7. 记一次24色卡LAB的过程
  8. 小猪佩奇网页 html源码 期末大作业 课程设计
  9. Bzoj2073 [POI2004] PRZ
  10. PS中Ctrl+Alt+G创建剪贴蒙版