想拿一下粉丝数 关注数 描述等
发现字体是加密的 elements是这样的

源代码里是这样的

找了找js 原来是用


1

这些玩意 去

这个ttf里一一对应 然后用 js + css画出来的
找到问题所在,就fuck掉它
把js扣出来?用execjs去执行?太LOW了
既然做python 那就用python去重写
首先用re去拿这个ttf的url (因为每次都变)

先给这玩意下载下来 把这个ttf文件扔fonteditor里 然后去
http://fontstore.baidu.com/static/editor/index.html
瞅瞅

这个时候就发现了东西

不就是这玩意吗,找到对应关系了 那就ok了
TTF文件没办法直接搞啊 ?怎么办
保存成xml !

然后就成了这玩意 ok对应关系也有了 python也能搞了

去写一下 整逻辑就是
先去拿 ttf文件 url 请求url 保存 然后转xml
然后 拿加密前的特殊字符

# 就是这玩意

12

然后去切割 对应 OK完事
对应关系的代码
根据看到的 id : 0啥也不说
从1~15 就是这些东西

上代码

# 对应关系 def kuaishou_un_font(soup, font_size):# soup 就是传的 ttf转码成xml的font_dict = {}for font_m in soup.glyphorder.children:if font_m != '\n' and 'humans' not in font_m:id = font_m.get('id')name = font_m.get('name')if id != '0' and int(id) < 11:font_dict[name] = str(int(id)-1)elif id == '11':font_dict[name] = '.'elif id == '12':font_dict[name] = 'w'elif id == '13':font_dict[name] = 'k'elif id == '14':font_dict[name] = 'm'elif id == '15':font_dict[name] = '+'size_dict = {}for font_k in soup.cmap_format_4.children:if 'map' in str(font_k):code = font_k.get('code')[-4:]name = font_k.get('name')size_dict[code] = namereturn font_dict[size_dict[font_size]]

然后是拿TTF 文件然后转成xml

# TTF转XMLfont = TTFont('font_size.ttf')font.saveXML('font_size.xml')

和split后list去一一解密

# font_url 自己去动态拿 每次都变动
font_url = ''
font_res = requests.get(font_url)with open('font_size.ttf', 'wb+') as f:f.write(font_res.content)font = TTFont('font_size.ttf')font.saveXML('font_size.xml')soup = BeautifulSoup(open('font_size.xml'), 'lxml')try:fan = user_data_json['obfuseData']['fan'][40:-8].split(';&#x')fans = ''for f in fan:fans += kuaishou_un_font(soup, f)except:fans = ''

最后

OK~ 解码完成 全部代码没放 因为是根据需求写的 懒得改成大家都能用的了 主要是给个思路 思路有了就很简单 需要的找我

大家可以批量paqu!

此文转载文,著作权归作者所有,如有侵权联系小编删除!

原文地址:https://blog.csdn.net/qq_41367883/article/details

完整项目代码获取点这

快手爬虫,解决粉丝数,关注数等字体加密!python快手爬虫相关推荐

  1. 快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫

    想拿一下粉丝数 关注数 描述等 发现字体是加密的 elements是这样的 源代码里是这样的 找了找js 原来是用  这些玩意 去 这个ttf里一一对应 然后用 js + css画出来的 找 ...

  2. 爬虫破解安居客等网址信息字体加密

    爬虫破解安居客等网址信息字体加密fanchan-secret 以安居客网站为例,我们爬取的房价以及其他很多数字都是乱码,閏龤龤龤元/月,龒室龤厅龒卫龥龤㎡. 右键检查元素会发觉,看上去正常的数字,在h ...

  3. python新闻爬虫系统的功能_基于Scrapy框架的Python新闻爬虫

    一.开发背景 Python作为数据处理方面的一把好手,近年来的热度不断增长.网络爬虫可以说是Python最具代表性的应用之一,那么通过网络爬虫来学习Python以及网络和数据处理的相关内容可以说是再合 ...

  4. python爬虫爬取房源_手把手教你用Python网络爬虫爬取新房数据

    项目背景 大家好,我是J哥. 新房数据,对于房地产置业者来说是买房的重要参考依据,对于房地产开发商来说,也是分析竞争对手项目的绝佳途径,对于房地产代理来说,是踩盘前的重要准备. 今天J哥以「惠民之家」 ...

  5. 【Python爬虫系列教程 41-100】猫眼电影字体加密破解

    文章目录 前言 -- 字体加密 1. 字体文件 1.1 猫眼网站分析 1.2 字体文件分析 2. 代码实现 2.1 字体文件处理 2.2 xml文件解析 2.3 代码实现 前言 – 字体加密 ​ 字体 ...

  6. python爬虫反爬策略_抖音字体反爬,爬虫字体反爬策略——每周一个爬虫小教程系列...

    在B站上看到一个关于抖音字体反爬的视频,看完之后,精神抖擞,不禁感觉,我又行了,于是在模拟器上下载了一个抖音,打开了我尘封已久的抖音号. 可以看见显示的数字是正常的,但是查看源码就是错误的. 既然是字 ...

  7. python快手爬虫:解决粉丝数、 关注数等字体加密

    想拿一下粉丝数 关注数 描述等 发现字体是加密的 elements是这样的 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手. 很多已经做 ...

  8. 爬虫爬取微博用户粉丝及其关注

    爬虫爬取微博用户粉丝及其关注 前言 ​ ​ 前段时间做了一个爬虫爬取微博用户粉丝及其关注的小项目,但忙着中期毕设答辩忘了加以记录了.对于动态网页的解决办法是使用selenium(上手比较快,而且抓包实 ...

  9. Python网络爬虫数据采集实战:Scrapy框架爬取QQ音乐存入MongoDB

    ​    通过前七章的学习,相信大家对整个爬虫有了一个比较全貌的了解 ,其中分别涉及四个案例:静态网页爬取.动态Ajax网页爬取.Selenium浏览器模拟爬取和Fillder今日头条app爬取,基本 ...

最新文章

  1. Extensible Messaging and Presence Protocol (XMPP): Core
  2. python可以做什么系统-python能做哪方面的工作
  3. HBTS(HBOI) 2019 真实退役记
  4. 加密托管机构Komainu与英国当局合作存储没收的加密货币
  5. matlab中round函数_Excel中round函数的使用方法
  6. 苹果新的编程语言 Swift 语言进阶(二)--基本数据类型
  7. Git:git pull 的使用
  8. Java方法重载与方法重写的区别
  9. python标准库math中用来计算平方根的函数_Python程序设计试题(卷)库
  10. VBA下载糗事百科图片
  11. 微信电脑版找不到服务器,实用微信小技巧:微信无法连接服务器解决办法
  12. 2021年中国企业信息归档(EIA)市场趋势报告、技术动态创新及2027年市场预测
  13. chatter命令详解(用来记录知识)
  14. matlab模拟风场竖桥向时程,大跨度桥梁三维脉动风场的计算机模拟
  15. c语言调易语言dll,易语言DLL来返回文本供其他语言调用
  16. ssh服务器banner信息,几种情况下的banner信息修改
  17. 【BLE】跳频算法实例分析
  18. java 给excel添加一列_java操作excel在开始位置添加一列
  19. EngineerCMS利用梦想CAD控件MXdraw进行图纸在线编辑,保存到服务器
  20. 0基础怎么学游戏建模?

热门文章

  1. homeassistant 百度语音服务的调用
  2. 深度学习实战13(进阶版)-文本纠错功能,经常写错别字的小伙伴的福星
  3. 大学生创业的税收优惠政策有哪些
  4. 设计原则-迪米特原则与合成复用原则
  5. docker安装部署OpenLdap
  6. 保姆级教学 nps内网穿透实现Windows远程桌面 宝塔
  7. 爆笑!「程序员吐槽大会」只有程序员听懂的段子!
  8. 网络安全 第4章 安全电子邮件-PGP
  9. ASP.NET入门随想之博德之门 类与实例
  10. struts2-总结篇