注:本文为个人学习探索历程

如果直接对该链接(甲骨文“获”之写意笛子谱/洞箫谱(为F调箫而作)_器乐乐谱_中国曲谱网 (qupu123.com))发起请求,得到的数据里只有一张图片的链接(其他几张的链接都用的第一张的代替的),因为剩下的都是异步加载再重新安排上去的(老奸巨猾手段)

首先我是去从异步请求中找包含加载图片的请求,果不其然被我找到了,然后开始分析链接的参数,但这个参数我没有在一开始得到的数据中找到,不用猜是加密了

所以我开始顺藤摸瓜的去找发起该请求的发起程序,顺利的找到了加密部分的js,然后保存到本地开始解密,一般来说解密出相关加密手段后用python代替这一过程就差不多好了(或者用node.js搭配python那样也可以)

但我突然想起这个页面的加载好像是有一个查看剩余曲谱按钮的(在最开始爬取的html数据里有这个东西),但它属性设置的style="display: none;"也就是隐藏起来了,那我把他调试成显示看看能不能用,能不能从它身上做点文章呢。于是我把style属性删了让这个控件显示出来,通过点击它发现它真的有效,在网络里也监控到了一系列请求

 

接下来对这几个请求进行分析一下,发现这一系列的请求中没有加密,只是请求次数多了点,而且主要看着三个请求

第一个get请求,该链接从上面说的这个控件里来,得到的参数重要部分如图

第二个post请求,参数由上一个链接中得到,该链接得到的数据中包含剩下图片的链接部分

最后将得到的部分链接和前半固定部分拼接就是剩下的图片的链接

整体思路出来了,接下来的爬虫也好写了

中国曲谱网爬虫研究(Python)相关推荐

  1. python爬虫爬取中国天气网_【实战】中国天气网爬虫之华北城市数据爬取

    概述: 在人工智能来临的今天,数据显得格外重要.在互联网的浩瀚大海洋中,隐藏着无穷的数据和信息.因此学习网络爬虫是在今天立足的一项必备技能.本路线专门针对想要从事Python网络爬虫的同学而准备的,并 ...

  2. 中国天气网爬虫数据可视化

    目录 中国天气网爬虫数据可视化 爬虫功能 网页分析 以华北地区为例分析网页源代码 1.以谷歌浏览器为例分析 2. 提取特征标签 3.分析源代码 利用requests库获取目标网页源代码 利用Beaut ...

  3. 中国土地市场网爬虫——字体woff加密还原

    通过我上篇博客:中国土地市场网爬虫--浏览器Cookie验证(简单) 和中国土地市场爬虫--浏览器cookie验证(图片验证码)讲述了中国土地市场网(www.landchina.com)的两种访问限制 ...

  4. [网络爬虫|smtp协议|python]东方财富网爬虫,python smtp协议发送爬取数据至QQ邮箱

    本文改自 [网络爬虫|smtp协议|python]东方财富网爬虫,python smtp协议发送爬取数据至QQ邮箱 之前写的爬虫单子,代码已经跑了快3个月了,后续又增加了一些需求,修改了一些小bug ...

  5. python爬虫为什么xpath路径正确却检索不到内容_中国知网爬虫

    一.知网介绍 提起中国知网,如果你曾经写过论文,那么基本上都会与中国知网打交道,因为写一篇论文必然面临着各种查重,当然翟博士除外.但是,本次重点不在于写论文跟查重上,而在于我们要爬取知网上一些论文的数 ...

  6. 中国土地市场网爬虫——浏览器Cookie验证(简单)

    很久以前研究过中国土地市场网(www.landchina.com),当时只抓取了一个城市的数据2万多条的数据,当时只是觉得服务器经常宕机,还没有发现有怎么反爬虫的限制.最近空闲准备把所以的数据抓取下来 ...

  7. 用计算机弹生僻字乐谱,生僻字 E调 (拇指琴卡林巴琴弹奏谱)_谱友园地_中国曲谱网...

    <生僻字 E调>文本歌词 我们中国的汉字,落笔成画留下五千年的历史 让世界都认识,我们中国的汉字,一撇一捺都是故事 跪举火把虔诚像道光,四方田地落谷成仓,古人象形声意辨恶良 魃(bá)魈( ...

  8. 小半计算机谱子,小半 _桃李醉春风个人制谱园地_中国曲谱网

    <小半>文本歌词 陈粒 - 小半 作曲 : 陈粒 作词 : 涂玲子 不敢回看 左顾右盼不自然的暗自喜欢 偷偷搭讪总没完地坐立难安 试探说晚安 多空泛又心酸 低头呢喃 对你的偏爱太过于明目张 ...

  9. 98k用计算机图片,98K (HandClap)_谱友园地_中国曲谱网

    <98K>文本歌词 98K之歌-HandClap- 抖音 制谱:孙世彦 这首<HandClap>是Fitz&The Tantrums乐队演唱的一首歌曲,同时也是绝地求生 ...

  10. 中国土地市场网爬虫案例

    本案例以土地市场列表页请求.供地结果搜索页请求为例,其实网站采集难度不大,但是一些细节值得学习. 链接:https://www.landchina.com/default.aspx?tabid=263 ...

最新文章

  1. Linux下进程间通信——管道
  2. 匿名函数的this指向为什么是window?
  3. 程序员面试题精选100题(42)-旋转数组的最小元素[算法]
  4. Linux下显示ip所属位置
  5. 超完整的 Chrome 浏览器客户端调试大全
  6. postman电脑版无法安装_Postman 安装及使用入门教程
  7. bootstrap切换tab页局部刷新_bootstrap在 刷新页面,tab选择页面不会改变。
  8. 令程序员们夜不能寐的“噩梦”除了改需求,还有这些…...
  9. mpchart点击_MPAndroidChart实现K线面板(一)
  10. 阶段3 2.Spring_03.Spring的 IOC 和 DI_13 课程知识梳理
  11. RHEL4-VNC服务(二)vnc服务器的配置
  12. Java面试常考之 单例设计模式(饿汉式单例、 懒汉式单例)
  13. linux|shell脚本|有趣的知识---格式化输出日志和脚本调试方法以及kubernetes集群核心服务重启和集群证书备份脚本
  14. R语言的三种聚类方法
  15. MySql Order By 多个字段 排序规则
  16. java解析mpp文件(包含层级关系)
  17. 设计c语言程序能否订火车票,C语言-购买火车票原理
  18. 边缘模式EPOLLET EPOLLOUT简单例子
  19. 关于我在中华读书报发表的文章
  20. 做好软件项目,产品经理该具备哪些优秀特质?

热门文章

  1. 计算机比赛参赛口号,计算机加油运动会口号
  2. 汇编实验——乐曲程序(两只老虎)
  3. Linux环境Java给图片加水印中文乱码处理
  4. 2020年国内外值得关注的15家PaaS平台与SaaS厂商!
  5. scrapy框架中Spider源码解析
  6. vue3警告Extraneous non-emits event listeners (XXX) were passed to component but could not be automatic
  7. 基于到达时间差(TDOA)的室内定位(/无线传感器网络定位)——极大似然估计ML
  8. 蛤蟆 Oracle,19.蛤蟆的Oracle杂记——数据字典dba_views
  9. 计算机专业的大一学生暑假6,一个计算机专业大三学生的一天 Day6
  10. Android7.0 头像 拍照、照片裁剪