有时候,我们很想爬取一个网站的数据。如果 PC 端的网页的反爬机制太强,我们可以换个思路。现在很多网站为了满足手机浏览器能正常访问的需求,都会推出手机版的网页。PC 端抓取数据有难度,我们可以从手机端入手。

你也许听说过,抓取手机 App 端数据就需要搭建手机抓包环境。那么我们就要屁颠屁颠去抓包搭建?哈哈,显然不用。我给大家分享一个小技巧,可以节省搭建环境的时间。

我们的抓取目标是 Web 手机端页面数据,而不是 App 端内的数据。因此,我们只要使用 PC 浏览器访问手机 Web 页面,就能继续使用 PC 浏览器进行抓包分析。

举个栗子,假如我要抓取淘宝首页的数据。我先用手机浏览器访问淘宝网站。

然后获取到手机端淘宝首页的 url 地址。

从图中,我们可知淘宝 web 手机端首页地址是:https://h5.m.taobao.com/。接着我们再用 PC 浏览器访问。

PC 端浏览器能正常访问,说明我们能使用浏览器自带的开发者工具来进行抓包分析。

一个爬取网站的小技巧相关推荐

  1. Python网络爬虫——爬取网站图片小工具

    最近初学python爬虫,就写了一个爬取网站图片的小工具,界面如下: 用到的包主要是爬虫常用的urllib,urllib2和图形界面用的Tkinter,完整代码如下: # -*- coding:utf ...

  2. Pycharm + python 爬虫简单爬取网站数据

    本文主要介绍简单的写一个爬取网站图片并将图片下载的python爬虫示例. 首先,python爬虫爬取数据,需要先了解工具包requests以及BeautifulSoup requests中文文档:ht ...

  3. Github每日精选(第75期):colly 爬取网站所有的数据

    colly colly 是一个优雅的 Golang 爬虫框架. colly 提供了一个干净的接口来编写任何类型的爬虫/scraper/spider. 使用 Colly,您可以轻松地从网站中提取结构化数 ...

  4. python爬取整个网站_python爬取网站全部url链接

    御剑自带了字典,主要是分析字典中的网址是否存在,但是可能会漏掉一些关键的网址,于是前几天用python写了一个爬取网站全部链接的爬虫. 实现方法 主要的实现方法是循环,具体步骤看下图: 贴上代码: # ...

  5. 一个爬取沪深两市融资融券标的融资融券交易数据的小爬虫

    1.学习初衷 本着紧跟时代进步步伐,坚决不拖社会主义建设后腿的想法,紧赶大数据.数据分析.机器学习的趋势......当然,前面只是瞎扯了. 最后我综合考虑R跟Python,最终还是选择走上了pytho ...

  6. 用python爬小说_今天分享一个用Python来爬取小说的小脚本!(附源码)

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章天气预报数据分析与统计之美 ,作者:❦大头雪糕❦ Python GUI制作小说下载器教学讲 ...

  7. python爬取天气预报数据并保存为txt格式_今天分享一个用Python来爬取小说的小脚本!(附源码)...

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章天气预报数据分析与统计之美 ,作者:❦大头雪糕❦ Python GUI制作小说下载器教学讲 ...

  8. 第一个爬虫项目-爬取唯美小姐姐网站

    爬取唯美小姐姐网站 链接: 源代码文件下载地址 展示 源代码 import requests import re import os import time# 伪装 用于可以伪装成浏览器. heade ...

  9. 如何爬一个网站的数据-免费爬取网站的任意数据软件

    如何爬一个网站的数据?爬取网络数据大家称之为网络爬行 收集页面以创建索引或集合.另一方面,网络抓取下载页面以提取一组特定的数据用于分析目的,例如,产品详细信息.定价信息.SEO 数据或任何其他数据集. ...

最新文章

  1. 逆clarke变换_是clarke变换还是clark
  2. centos 7.0 ln命令 和chkconfig 命令介绍 开机自动启 服务
  3. 消息队列概述[幻灯片]
  4. java 酒店预定 app_Android应用源码酒店在线预定app项目全套
  5. hawq state 报错: the database is down, but Ambari shows all hawq services as being
  6. 伊恩斯普里格斯3D肖像的秘密
  7. Android四大组件每个组件的作用?它们都可以开启多进程吗?
  8. SQL SERVER 2005 批量收缩数据库
  9. Qt5.14.2 VS2019创建Qt项目并使用QSS美化界面(附QSS资源下载)
  10. gliffy confluen插件gliffy-confluence-plugin-5.1.ja破解
  11. 大数据学习---HIVE入门SQL学习
  12. 【Request】全面总结并理解request
  13. FPGA - 7系列 FPGA内部结构之SelectIO -05- 逻辑资源之OLOGIC
  14. STM32开发项目:步进电机驱动库
  15. 使用git提交到仓库使用commit指令出现问题Your branch and 'origin/master' have diverged,
  16. 小程序中设置全屏背景图
  17. windos10系统 激活
  18. Java之final修饰变量
  19. 《深入浅出SQL》问答录
  20. 奇葩之想让我帮写代码还要白嫖

热门文章

  1. JOffice协同办公开发平台
  2. 新安装WIN10网卡未驱动,驱动人生网卡版等软件不能成功安装网卡的解决办法...
  3. 再探SSRF服务器请求伪造(weblogic cve ssrf redis未授权)
  4. PHP5.6连接数据库和一些简单操作
  5. 卷皮网大数据之路-《猫友会大数据系列分享》
  6. 解决Win10微软拼音输入法与Visual Studio编译快捷键冲突
  7. verilog的取余和除法
  8. 疫情期间,找工作有多难?
  9. Arduino uno循迹小车总结
  10. [小说]魔王冢(19)危险的情人