大众点评数字加密,字体加密,可以在网站上下载相应的字体文件,关键是做一些字体映射,汉字因为太多了,自己粘贴下来一部分,有兴趣的可以可以进行识别,不过据说识别=成功率不稳定,不说了,直接上代码

# -*- coding: utf-8 -*-
from fontTools.ttLib import TTFont
import requests
from lxml import etree# 数字加密
def get_font():font = TTFont(r'D:\谷歌下载\0e8bea27.woff')font_names = font.getGlyphOrder()# 这些文字就是在FontEditor软件打开字体文件后看到的文字名字texts = ['','','1','2','3','4','5','6','7','8','9','0']font_name = {}# 将字体名字和它们所对应的乱码构成一个字典 for index,value in enumerate(texts):a = font_names[index].replace('uni', '&#x').lower() + ";"font_name[a] = valuereturn font_name# 介绍加密
def get_font1():font = TTFont(r'D:\谷歌下载\8d65b94b.woff')font_names = font.getGlyphOrder()# 这些文字就是在FontEditor软件打开字体文件后看到的文字名字texts = ['','','1', '2', '3', '4', '5', '6', '7', '8', '9', '0', '店', '中', '美', '家', '馆', '小', '车', '大', '市', '公', '酒', '行', '国', '品', '发', '电', '金', '心', '业', '商', '司', '超', '生', '装', '园', '场', '食', '有', '新', '限', '天', '面', '工', '服', '海', '华', '水', '房', '饰', '城', '乐', '汽', '香', '部', '利', '子', '老', '艺', '花', '专', '东', '肉', '菜', '学', '福', '饭', '人', '百', '餐', '茶', '务', '通', '味', '所', '山', '区', '门', '药', '银', '农', '龙', '停', '尚', '安', '广', '鑫', '一', '容', '动', '南', '具', '源', '兴', '鲜', '记', '时', '机', '烤', '文', '康', '信', '果', '阳', '理', '锅', '宝', '达', '地', '儿', '衣', '特', '产', '西', '批', '坊', '州', '牛', '佳', '化', '五', '米', '修', '爱', '北', '养', '卖', '建', '材', '三', '会', '鸡', '室', '红', '站', '德', '王', '光', '名', '丽', '油', '院', '堂', '烧', '江', '社', '合', '星', '货', '型', '村', '自', '科', '快', '便', '日', '民', '营', '和', '活', '童', '明', '器', '烟', '育', '宾', '精', '屋', '经', '居', '庄', '石', '顺', '林', '尔', '县', '手', '厅', '销', '用', '好', '客', '火', '雅', '盛', '体', '旅', '之', '鞋', '辣', '作', '粉', '包', '楼', '校', '鱼', '平', '彩', '上', '吧', '保', '永', '万', '物', '教', '吃', '设', '医', '正', '造', '丰', '健', '点', '汤', '网', '庆', '技', '斯', '洗', '料', '配', '汇', '木', '缘', '加', '麻', '联', '卫', '川', '泰', '色', '世', '方', '寓', '风', '幼', '羊', '烫', '来', '高', '厂', '兰', '阿', '贝', '皮', '全', '女', '拉', '成', '云', '维', '贸', '道', '术', '运', '都', '口', '博', '河', '瑞', '宏', '京', '际', '路', '祥', '青', '镇', '厨', '培', '力', '惠', '连', '马', '鸿', '钢', '训', '影', '甲', '助', '窗', '布', '富', '牌', '头', '四', '多', '妆', '吉', '苑', '沙', '恒', '隆', '春', '干', '饼', '氏', '里', '二', '管', '诚', '制', '售', '嘉', '长', '轩', '杂', '副', '清', '计', '黄', '讯', '太', '鸭', '号', '街', '交', '与', '叉', '附', '近', '层', '旁', '对', '巷', '栋', '环', '省', '桥', '湖', '段', '乡', '厦', '府', '铺', '内', '侧', '元', '购', '前', '幢', '滨', '处', '向', '座', '下', '県', '凤', '港', '开', '关', '景', '泉', '塘', '放', '昌', '线', '湾', '政', '步', '宁', '解', '白', '田', '町', '溪', '十', '八', '古', '双', '胜', '本', '单', '同', '九', '迎', '第', '台', '玉', '锦', '底', '后', '七', '斜', '期', '武', '岭', '松', '角', '纪', '朝', '峰', '六', '振', '珠', '局', '岗', '洲', '横', '边', '济', '井', '办', '汉', '代', '临', '弄', '团', '外', '塔', '杨', '铁', '浦', '字', '年', '岛', '陵', '原', '梅', '进', '荣', '友', '虹', '央', '桂', '沿', '事', '津', '凯', '莲', '丁', '秀', '柳', '集', '紫', '旗', '张', '谷', '的', '是', '不', '了', '很', '还', '个', '也', '这', '我', '就', '在', '以', '可', '到', '错', '没', '去', '过', '感', '次', '要', '比', '觉', '看', '得', '说', '常', '真', '们', '但', '最', '喜', '哈', '么', '别', '位', '能', '较', '境', '非', '为', '欢', '然', '他', '挺', '着', '价', '那', '意', '种', '想', '出', '员', '两', '推', '做', '排', '实', '分', '间', '甜', '度', '起', '满', '给', '热', '完', '格', '荐', '喝', '等', '其', '再', '几', '只', '现', '朋', '候', '样', '直', '而', '买', '于', '般', '豆', '量', '选', '奶', '打', '每', '评', '少', '算', '又', '因', '情', '找', '些', '份', '置', '适', '什', '蛋', '师', '气', '你', '姐', '棒', '试', '总', '定', '啊', '足', '级', '整', '带', '虾', '如', '态', '且', '尝', '主', '话', '强', '当', '更', '板', '知', '己', '无', '酸', '让', '入', '啦', '式', '笑', '赞', '片', '酱', '差', '像', '提', '队', '走', '嫩', '才', '刚', '午', '接', '重', '串', '回', '晚', '微', '周', '值', '费', '性', '桌', '拍', '跟', '块', '调', '糕']font_name = {}# 将字体名字和它们所对应的乱码构成一个字典for index,value in enumerate(texts):a = font_names[index].replace('uni', '&#x').lower() + ";"font_name[a] = valuereturn font_name# 地址加密
def get_font2():font = TTFont(r'D:\谷歌下载\ef31b82b.woff')font_names = font.getGlyphOrder()# 这些文字就是在FontEditor软件打开字体文件后看到的文字名字texts = ['','','1', '2', '3', '4', '5', '6', '7', '8', '9', '0', '店', '中', '美', '家', '馆', '小', '车', '大', '市', '公', '酒', '行', '国', '品', '发', '电', '金', '心', '业', '商', '司', '超', '生', '装', '园', '场', '食', '有', '新', '限', '天', '面', '工', '服', '海', '华', '水', '房', '饰', '城', '乐', '汽', '香', '部', '利', '子', '老', '艺', '花', '专', '东', '肉', '菜', '学', '福', '饭', '人', '百', '餐', '茶', '务', '通', '味', '所', '山', '区', '门', '药', '银', '农', '龙', '停', '尚', '安', '广', '鑫', '一', '容', '动', '南', '具', '源', '兴', '鲜', '记', '时', '机', '烤', '文', '康', '信', '果', '阳', '理', '锅', '宝', '达', '地', '儿', '衣', '特', '产', '西', '批', '坊', '州', '牛', '佳', '化', '五', '米', '修', '爱', '北', '养', '卖', '建', '材', '三', '会', '鸡', '室', '红', '站', '德', '王', '光', '名', '丽', '油', '院', '堂', '烧', '江', '社', '合', '星', '货', '型', '村', '自', '科', '快', '便', '日', '民', '营', '和', '活', '童', '明', '器', '烟', '育', '宾', '精', '屋', '经', '居', '庄', '石', '顺', '林', '尔', '县', '手', '厅', '销', '用', '好', '客', '火', '雅', '盛', '体', '旅', '之', '鞋', '辣', '作', '粉', '包', '楼', '校', '鱼', '平', '彩', '上', '吧', '保', '永', '万', '物', '教', '吃', '设', '医', '正', '造', '丰', '健', '点', '汤', '网', '庆', '技', '斯', '洗', '料', '配', '汇', '木', '缘', '加', '麻', '联', '卫', '川', '泰', '色', '世', '方', '寓', '风', '幼', '羊', '烫', '来', '高', '厂', '兰', '阿', '贝', '皮', '全', '女', '拉', '成', '云', '维', '贸', '道', '术', '运', '都', '口', '博', '河', '瑞', '宏', '京', '际', '路', '祥', '青', '镇', '厨', '培', '力', '惠', '连', '马', '鸿', '钢', '训', '影', '甲', '助', '窗', '布', '富', '牌', '头', '四', '多', '妆', '吉', '苑', '沙', '恒', '隆', '春', '干', '饼', '氏', '里', '二', '管', '诚', '制', '售', '嘉', '长', '轩', '杂', '副', '清', '计', '黄', '讯', '太', '鸭', '号', '街', '交', '与', '叉', '附', '近', '层', '旁', '对', '巷', '栋', '环', '省', '桥', '湖', '段', '乡', '厦', '府', '铺', '内', '侧', '元', '购', '前', '幢', '滨', '处', '向', '座', '下', '県', '凤', '港', '开', '关', '景', '泉', '塘', '放', '昌', '线', '湾', '政', '步', '宁', '解', '白', '田', '町', '溪', '十', '八', '古', '双', '胜', '本', '单', '同', '九', '迎', '第', '台', '玉', '锦', '底', '后', '七', '斜', '期', '武', '岭', '松', '角', '纪', '朝', '峰', '六', '振', '珠', '局', '岗', '洲', '横', '边', '济', '井', '办', '汉', '代', '临', '弄', '团', '外', '塔', '杨', '铁', '浦', '字', '年', '岛', '陵', '原', '梅', '进', '荣', '友', '虹', '央', '桂', '沿', '事', '津', '凯', '莲', '丁', '秀', '柳', '集', '紫', '旗', '张', '谷', '的', '是', '不', '了', '很', '还', '个', '也', '这', '我', '就', '在', '以', '可', '到', '错', '没', '去', '过', '感', '次', '要', '比', '觉', '看', '得', '说', '常', '真', '们', '但', '最', '喜', '哈', '么', '别', '位', '能', '较', '境', '非', '为', '欢', '然', '他', '挺', '着', '价', '那', '意', '种', '想', '出', '员', '两', '推', '做', '排', '实', '分', '间', '甜', '度', '起', '满', '给', '热', '完', '格', '荐', '喝', '等', '其', '再', '几', '只', '现', '朋', '候', '样', '直', '而', '买', '于', '般', '豆', '量', '选', '奶', '打', '每', '评', '少', '算', '又', '因', '情', '找', '些', '份', '置', '适', '什', '蛋', '师', '气', '你', '姐', '棒', '试', '总', '定', '啊', '足', '级', '整', '带', '虾', '如', '态', '且', '尝', '主', '话', '强', '当', '更', '板', '知', '己', '无', '酸', '让', '入', '啦', '式', '笑', '赞', '片', '酱', '差', '像', '提', '队', '走', '嫩', '才', '刚', '午', '接', '重', '串', '回', '晚', '微', '周', '值', '费', '性', '桌', '拍', '跟', '块', '调', '糕']font_name = {}# 将字体名字和它们所对应的乱码构成一个字典for index,value in enumerate(texts):a = font_names[index].replace('uni', '&#x').lower() + ";"font_name[a] = valuereturn font_nameheaders = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36','cookie':'_lxsdk_cuid=17446fb1a50c8-0000cf59af007e-3323766-1fa400-17446fb1a51c8; _lxsdk=17446fb1a50c8-0000cf59af007e-3323766-1fa400-17446fb1a51c8; _hc.v=179f0017-503c-769c-f663-16656ae91180.1598918696; aburl=1; Hm_lvt_dbeeb675516927da776beeb1d9802bd4=1598918774; cy=2; cye=beijing; s_ViewType=10; Hm_lvt_602b80cf8079ae6591966cc70a3940e7=1604642713,1604642727; fspop=test; _lx_utm=utm_source%3DBaidu%26utm_medium%3Dorganic; hotelTime=2020-11-10%7C2020-11-11; cityInfo=%7B%22cityId%22%3A2%2C%22cityName%22%3A%22%E5%8C%97%E4%BA%AC%22%2C%22provinceId%22%3A0%2C%22parentCityId%22%3A0%2C%22cityOrderId%22%3A0%2C%22isActiveCity%22%3Afalse%2C%22cityEnName%22%3A%22beijing%22%2C%22cityPyName%22%3Anull%2C%22cityAreaCode%22%3Anull%2C%22cityAbbrCode%22%3Anull%2C%22isOverseasCity%22%3Afalse%2C%22isScenery%22%3Afalse%2C%22TuanGouFlag%22%3A0%2C%22cityLevel%22%3A0%2C%22appHotLevel%22%3A0%2C%22gLat%22%3A0%2C%22gLng%22%3A0%2C%22directURL%22%3Anull%2C%22standardEnName%22%3Anull%7D; Hm_lpvt_602b80cf8079ae6591966cc70a3940e7=1604972278; _lxsdk_s=175afa1a3b2-608-104-8f5%7C%7C958'
}
url = 'http://www.dianping.com/beijing/ch10/g110'html = requests.get(url, headers=headers).text# 映射对象获取
num = get_font()
num1 = get_font1()
num2 = get_font2()for key in num:if key in html:html = html.replace(key, str(num[key]))
for key1 in num1:if key1 in html:html = html.replace(key1, str(num1[key1]))
for key2 in num2:if key2 in html:html = html.replace(key2, str(num2[key2]))# with open('data.html','w',encoding='utf-8') as f:
#     f.write(html)
#     f.close()parse_html = etree.HTML(html)listt = parse_html.xpath('//div[@class="content"]//div[@id="shop-all-list"]/ul//li')for tt in listt:title = tt.xpath('.//div[@class="tit"]//h4/text()')[0]print(title)

这里只是xpath出来的title,剩下的直接找就能出来

2020-11-10大众点评字体反爬抓取信息相关推荐

  1. tesseract破解css反爬抓取自如租房信息

    引言 作为一个刚毕业两年的打工人,在深圳这种房价压死人的城市,买房是不可能买房了,只能寄希望于租到一个便宜又舒适的房子.今天给大家带来的案例是tesseract破解css反爬抓取自如租房信息,将好房源 ...

  2. 大众点评评论反爬解决方案

    目前大众点评主要有两种反爬的机制:css反爬和字体反爬. css反爬的解决方案 具体详见反爬机制之css反爬详解 字体反爬的解决方案

  3. python爬取大众点评字体_python爬取大众点评解决字体反爬

    今天我们弄一下大众点评 学习阶段,我们要抱着学习的目的 重点是思路,做爬虫就不要想着一劳永逸了 方法公开,人家就换了 知识是你自己的,学到了,他换不掉 好了,我们开始吧 网站展示 https://ww ...

  4. python爬取大众点评评论_python爬虫抓取数据 小试Python——爬虫抓取大众点评上的数据 - 电脑常识 - 服务器之家...

    python爬虫抓取数据 小试Python--爬虫抓取大众点评上的数据 发布时间:2017-04-07

  5. python大众点评霸王餐_python抓取大众点评商户信息

    数据说明: 本次爬取大众点评共8个字段信息,包括: 商户名字, 口味评分, 环境评分,服务评分,人均价格,评论数量,地址,商户星级 然后把数据存入excel表格 一 .首页部分 我们可以看到有很多分类 ...

  6. 大众点评woff反爬

    一.调试 发现字体是加密的,猜测是自定义字体. 二.WTF woff? woff是一种网页采用的字体格式标准,-- 查看页面源代码,确认是woff加密 三.绕过 ①获取woff文件 随便选择一个标签, ...

  7. python爬虫进阶-汽车之家贴吧信息(字体反爬-动态映射)

    目的 获取汽车之家贴吧的内容信息 详细需求 汽车之家贴吧 思路解析 一.F12获取目标信息-进行分析 二.字体反爬解析-根据上一篇的文章,直接搜索关键词就好 三 根据其后的链接,保存为ttf在本地,查 ...

  8. python爬虫笔记五:汽车之家贴吧信息(字体反爬-动态映射)

    学习网址: https://jia666666.blog.csdn.net/article/details/108974149 ----------------------------------- ...

  9. Python爬虫 | 以滑雪为例演示大众点评商铺信息采集(字体反爬)

    文章目录 1.简述 2.字体反爬处理 2.1.获取字体文件链接 2.2.创建三类字体与实际字符映射关系 3.单页店铺信息解析 4.全部页数据获取 4.1.获取数据页数 4.2.采集全部数据 5.总结 ...

  10. python ttfont_58 字体反爬攻略 python3

    1.下载安装包 pip install fontTools 2.下载查看工具FontCreator 百度后一路傻瓜式安装即可 3.反爬虫机制 网页上看见的 后台源代码里面的 从上面可以看出,生这个字变 ...

最新文章

  1. oracle跑with语句很慢,oracle 11g新特性---WITH语句增强
  2. 字符数组和字符串的小细节
  3. 使用anconada 的conda更换环境
  4. linux服务器做301跳转,nginx 实现当找不到文件时实现301跳转
  5. 三点外接圆_故地重游伪切圆——伪外接圆的基本性质
  6. 1、Ribbon相关组件初始化 - Ribbon 核心原理与源码分析
  7. mysql数据库中 pri_mysql数据库part2
  8. 学生管理系统----当然封装类型
  9. 37. 重定向 21
  10. mysql中文参考手册 晏子_MySQL中文参考手册(目录)
  11. [图形学]ASTC纹理压缩格式
  12. 台式计算机输入设备,简述常用的输入设备和输出设备有哪些 – 手机爱问
  13. JavaScript修改表格行的背景色,鼠标所在行颜色高亮
  14. 炫酷的个人主页要怎么制作 ? |GitCode
  15. mysql存小程序获取到的带有表情的昵称_拉取用户信息,带表情的昵称,存储到数据库是???要怎么处理...
  16. 绘制太极图(CSS)
  17. 【数据库】快速理解脏读、不可重复读、幻读
  18. 螺旋测微器b类不确定度_物理实验直测量不确定度评估.ppt
  19. 赢胜智能:松下机器人维护
  20. Unity3D自转与公转-太阳系

热门文章

  1. 用7z命令压缩文件夹
  2. 解决windows10中springboot的jar启动之后的假死状态
  3. uniapp 前端获取历史搜索记录
  4. 修改串口服务器,串口虚拟化 | 串口服务器Nport 5630 设置
  5. Preparing for Exams(割线定理)
  6. 各领域公开数据集下载
  7. SignalR 循序渐进
  8. 【VSCode】设置代码格式化插件Beautify
  9. 计算机网络在资源共享信息交换的体会,计算机网络学习心得体会.doc
  10. 检测网络是否正常(ping,Telnet,tracert以及tnsping)