想拿一下粉丝数 关注数 描述等
发现字体是加密的 elements是这样的

很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:961562169


源代码里是这样的

找了找js 原来是用



这些玩意 去

这个ttf里一一对应 然后用 js + css画出来的
找到问题所在,就fuck掉它
把js扣出来?用execjs去执行?太LOW了
既然做python 那就用python去重写
首先用re去拿这个ttf的url (因为每次都变)

先给这玩意下载下来 把这个ttf文件扔fonteditor里 然后去
http://fontstore.baidu.com/static/editor/index.html
瞅瞅

这个时候就发现了东西


不就是这玩意吗,找到对应关系了 那就ok了
TTF文件没办法直接搞啊 ?怎么办
保存成xml !
然后就成了这玩意 ok对应关系也有了 python也能搞了

去写一下 整逻辑就是
先去拿 ttf文件 url 请求url 保存 然后转xml
然后 拿加密前的特殊字符

# 就是这玩意


然后去切割 对应 OK完事
对应关系的代码
根据看到的 id : 0啥也不说
从1~15 就是这些东西

上代码

# 对应关系 def kuaishou_un_font(soup, font_size):# soup 就是传的 ttf转码成xml的font_dict = {}for font_m in soup.glyphorder.children:if font_m != '\n' and 'humans' not in font_m:id = font_m.get('id')name = font_m.get('name')if id != '0' and int(id) < 11:font_dict[name] = str(int(id)-1)elif id == '11':font_dict[name] = '.'elif id == '12':font_dict[name] = 'w'elif id == '13':font_dict[name] = 'k'elif id == '14':font_dict[name] = 'm'elif id == '15':font_dict[name] = '+'size_dict = {}for font_k in soup.cmap_format_4.children:if 'map' in str(font_k):code = font_k.get('code')[-4:]name = font_k.get('name')size_dict[code] = namereturn font_dict[size_dict[font_size]]

然后是拿TTF 文件然后转成xml

# TTF转XMLfont = TTFont('font_size.ttf')font.saveXML('font_size.xml')

和split后list去一一解密

# font_url 自己去动态拿 每次都变动
font_url = ''
font_res = requests.get(font_url)with open('font_size.ttf', 'wb+') as f:f.write(font_res.content)font = TTFont('font_size.ttf')font.saveXML('font_size.xml')soup = BeautifulSoup(open('font_size.xml'), 'lxml')try:fan = user_data_json['obfuseData']['fan'][40:-8].split(';&#x')fans = ''for f in fan:fans += kuaishou_un_font(soup, f)except:fans = ''

最后

OK~ 解码完成 全部代码没放 因为是根据需求写的 懒得改成大家都能用的了 主要是给个思路 思路有了就很简单 需要的找我

python快手爬虫:解决粉丝数、 关注数等字体加密相关推荐

  1. 快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫

    想拿一下粉丝数 关注数 描述等 发现字体是加密的 elements是这样的 源代码里是这样的 找了找js 原来是用  这些玩意 去 这个ttf里一一对应 然后用 js + css画出来的 找 ...

  2. 快手爬虫,解决粉丝数,关注数等字体加密!python快手爬虫

    想拿一下粉丝数 关注数 描述等 发现字体是加密的 elements是这样的 源代码里是这样的 找了找js 原来是用  1 这些玩意 去 这个ttf里一一对应 然后用 js + css画出来的 ...

  3. 爬虫破解安居客等网址信息字体加密

    爬虫破解安居客等网址信息字体加密fanchan-secret 以安居客网站为例,我们爬取的房价以及其他很多数字都是乱码,閏龤龤龤元/月,龒室龤厅龒卫龥龤㎡. 右键检查元素会发觉,看上去正常的数字,在h ...

  4. Python爬取58同城租房数据,破解字体加密

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于CSDN,作者:TRHX • 鲍勃 刚接触Python的新手.小白,可以复制下面的链 ...

  5. python多进程爬虫解决进程挂掉问题

    这几天写了个爬虫,爬取的数据比较多.一直挂在服务器上跑,后面发现启动十个进程总会运行着某几个进程挂掉,导致数据采集工作比较延后. 后面重新改进了一下,从日志中读取当前进程断点,继续爬取. 用了一个笨方 ...

  6. 【Python爬虫系列教程 41-100】猫眼电影字体加密破解

    文章目录 前言 -- 字体加密 1. 字体文件 1.1 猫眼网站分析 1.2 字体文件分析 2. 代码实现 2.1 字体文件处理 2.2 xml文件解析 2.3 代码实现 前言 – 字体加密 ​ 字体 ...

  7. Python 网络爬虫实战:爬取《去哪儿》网数千篇旅游攻略数据,再也不愁旅游去哪儿玩了

    好久不见! 今天我们来爬取 去哪儿网站 的 旅游攻略 数据. 0x00  找一个合理的作案动机 作为一名立志成为技术宅的普通肥宅,每次一到周末就会面临一个人生难题:这周末怎么过? 本来是没有这些问题的 ...

  8. Python 网页爬虫 文本处理 科学计算 机器学习 数据挖掘兵器谱 - 数客

    曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python.离开腾讯创业后,第一个作品课程图谱也是选 ...

  9. 用Scrapy爬取新浪微博用户信息,粉丝,关注数

    通过一段时间对爬虫的学习,发现Scrapy框架真的是一个很好用的框架,接下来让我们用一个简单的例子,来见识一下Scrapy框架的强大之处. 本示例将获取新浪微博指定用户下的所有基本信息,粉丝和关注者, ...

最新文章

  1. php代码审计之MetInfo5.3盲注
  2. Qt学习笔记5-信号槽机制
  3. mysql两个表left join_mysql中两张表使用left join on 求差集
  4. php变量赋值有几种,【后端开辟】php变量赋值体式格局有几种
  5. ML之PLiR之LARS:利用LARS算法求解ElasticNet回归类型(包括类别编码+属性重要程度排序)问题(实数值年龄预测)
  6. C++容器的insert()函数有以下三种用法: 最终*it=val;
  7. 前端框架开始学习Vue(一)
  8. Oracle 11gR2 GI日常管理手册 1
  9. 读后感:软件测试经验与教训
  10. linux大io引起cpu使用率偏高,系统负载高, 但CPU使用率和IO都非常低
  11. riot.js教程【二】组件撰写准则、预处理器、标签样式和装配方法
  12. python语音开发库-各种 Python 库/模块/工具
  13. http文件下载c/c++ 多种方法
  14. listmanager htdocs
  15. SharePoint 读取选项字段所有Choise
  16. springboot整合RabbitMQ启动报错:An unexpected connection driver error occured,Socket Closed
  17. English Pod 听力学习之路 C41 - C68
  18. Word操作技巧大全1(转)
  19. 周明:NLP进步将如何改变搜索体验
  20. 数据库(My SQL 、SQL Server)的数据类型

热门文章

  1. 微软的苹果香味——专访微软MacBU组成员
  2. 【机器学习】使用scikitLearn对数据进行聚类:Kmeans聚类算法及聚类效果评估
  3. Android P指示灯调节代码逻辑
  4. Eclipese快捷键
  5. upload-labs刷关记录
  6. 二进制部署高可用k8s集群
  7. 微信小程序实现地图导航功能
  8. 优化问题-Lagrange函数和共轭函数
  9. 【NOIP2018提高组D2T2】填数游戏
  10. linux更换steam目录,如何在Linux上备份Steam游戏数据 | MOS86