首先打开网站

https://www.zymk.cn/1/37988.html

打开开发者工具

选择XHR标签页,没有找到什么

再查看一下这些图片的URL值

http://mhpic.xiaomingtaiji.net/comic/D%2F%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9%E6%8B%86%E5%88%86%E7%89%88%2F20%E8%AF%9D%2F1.jpg-zymk.middle.webp

尝试搜索图片元素

发现有一个js文件,打开搜索

发现这里有一个疑点,这不是html里面的字段吗,那么 “i.getPicUrl(e)” 不就是那个图片的URL的值了吗

在这里下一个断点,走你

果然,这个就那个图片URL生成的切入点,现在就是看调用栈,找到这个函数的起点,点击右侧的 ”e.init“,这里有一个setInitData函数,从名字来看,应该就是设置初始数据的地方,在这里下一个断点,进去看看

这里有一个this.imgpath,这个应该就是图片的URL值了,点击F10,再单步调式,来到了charcode函数

进去看看,这里应该就是加密函数了

这里一步步调式,不要着急,来到了这里

继续单步调式,在第二次打开这么VM文件的时候,”__cr.imgpath“这个看起来很熟悉呀

Plain Text

"L-:N-M>-A>-A?-M?-I8-J-@J-@>-M=-@@-@>-M?-@A-@@-:N:8-M@-IN-AL-:N"

打开页面源代码,就在这里啦,不仅仅有图片的URL加密值,还有其他数据,这些都是在后面图片URL拼接需要使用到的

现在我们再重新看看那个加密函数,它无非就是遍历那个加密值的每个字符,获取其Unicode值,再与__cr.chapter_id进行相关运算,然后再得到的Unicode数值返回字符

现在我们可以用python仿写这个算法

接下就是平常get请求获取必要的数据了,通过正则获取元素,拼接,以下是源码

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

本文标题: Python实现JS解密并爬取某音漫客网站

本文地址: http://www.cppcns.com/jiaoben/python/357226.html

python爬取网站的某一句话_Python实现JS解密并爬取某音漫客网站相关推荐

  1. python可抓取数据包括什么_Python对JS型数据抓取有什么特别好的方法吗,pythonjs型抓取,想写一个爬虫,但是需要抓...

    Python对JS型数据抓取有什么特别好的方法吗,pythonjs型抓取,想写一个爬虫,但是需要抓 想写一个爬虫,但是需要抓去的的数据是js生成的,在源代码里看不到,要怎么才能抓到呢? 最好是用pyt ...

  2. python爬音乐评论生成词云图_python爬虫+词云图,爬取网易云音乐评论

    又到了清明时节,用python爬取了网易云音乐<清明雨上>的评论,统计词频和绘制词云图,记录过程中遇到一些问题 爬取网易云音乐的评论 一开始是按照常规思路,分析网页ajax的传参情况.看到 ...

  3. python爬取地图上的经纬度_Python调用百度地图API爬取经纬度

    作者:国服帅座  经济学在读硕士 微信公众号:统计之家 你吃肯德基,我点麦当劳.本是替代品,却众口难调.每个人都有独特的偏好,都有一份要坚守的情怀.高德与百度,你心仪哪款呢? 认识百度地图API 百度 ...

  4. Python爬虫练习:JS解密,爬取某音漫客网站数据

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 以下文章来源于IT技术喵 ,作者 开瓶儿 首先打开网站 https://www. ...

  5. python爬数据以字典变量保存_python爬虫第7篇——爬取的数据如何存档

    不能让你暴富,但至少可以奔小康了! 想了解更多精彩内容,快来关注南大盛联 阅读本文,假定你使用的是Windows操作系统下面的python3.X版本. 并且已经掌握了一些基本的python操作.否则, ...

  6. python列表切片后得到剩余列表_python列表切片和嵌套列表取值操作详解

    python列表切片和嵌套列表取值操作详解 给出列表切片的格式: [开头元素::步长] # 输出直到最后一个元素,(最后一个冒号和步长可以省略,下同) [开头元素:结尾元素(不含):步长] # 其中, ...

  7. python与seo实战课程百度云_Python与seo实战课程 | 「讲文兄博客」

    一.培训说明 本期培训主要是面向想通过python来提高SEO工作效率的SEOer或者是对python爬虫感兴趣的目标人群. 培训的主要内容是学习如何通过python来开发各种SEO工具,以及pyth ...

  8. Python爬虫JS解密详解,学会直接破解80%的网站(一)!!!

    文章目录 1.网页查看 2.有道翻译简单实现源码 3.JS解密(详解) 4.python实现JS解密后的完整代码 4.1.实现效果 5.JS解密后完整代码升级版 5.1.实现效果 CSDN独家福利降临 ...

  9. github+hexo搭建自己的博客网站(六)进阶配置(搜索引擎收录,优化你的url,添加RSS)...

    详细的可以查看hexo博客的演示:https://saucxs.github.io/ 绑定了域名: http://www.chengxinsong.cn hexo+github博客网站源码(可以clo ...

最新文章

  1. LabVIEW轮廓分析与比较(基础篇—8)
  2. 史上世界上最惨烈的几次股灾!
  3. .net微软消息队列(msmq)简单案例
  4. springboot配置templates直接访问
  5. Spring之高级装配(二)
  6. ASPxGridView1单击,双击事件
  7. 微信小程序—day02
  8. php fopen 找不着文件,fopen 系统找不到指定路径 PHP文件包含详细讲述(4)
  9. Java线程面试题 Top 53
  10. 云和恩墨大讲堂电子刊2019年4月刊发布
  11. 【转】vb获得网络时间的函数
  12. React Echarts 点击事件
  13. wafer map格式转换_如何将谷歌地球KML图层转换为Mapinfo TAB图层?
  14. Hadoop实战之一~Hadoop概述
  15. 极限学习机(Extreme Learning Machine, ELM)原理详解和MATLAB实现
  16. java jni 调用_java jni调用过程分析
  17. 传奇gom引擎架设教程
  18. rtc驱动模型及rx8025驱动学习
  19. microsoftonenote_Microsoft OneNote 2017 官方免费版
  20. Python入门(10)——宝可梦数据集探索

热门文章

  1. 【Makefile】strip
  2. 发布订阅和观察者模式
  3. 开通微信公众号留言功能的开通问题
  4. 内蒙古科技大学计算机专业校企合作好不好,校企合作真的靠谱吗 有什么坏处...
  5. python 安卓模拟器 抓包_python + 爬虫 + fiddler + 夜神模拟器 爬取app(1)
  6. 植物大战僵尸2android最新版,植物大战僵尸2
  7. 令人十分期待的ECShopX BBC商城开放终身免费商用
  8. 【Geoserver】GeoServer安装GDAL扩展的方法总结
  9. Follow your heart (152)---很有意思的分屏搜索.
  10. 好饭不怕晚 —— CSDN博客专家认证通过