作为一名“数据狗”和“码字狗”,手机端APP的数据爬取应该是一项基础技能。其实随着手机的广泛使用,不管是谁,懂点爬取的知识都不吃亏,毕竟“技多不压身”嘛。今天分享的爬取工具与步骤非常简单,数据小白也能很快上手。

此文几个关键点:针对IOS手机应用、以“亲子年票”APP为例、抓包工具为fiddler(不用太了解其专业含义,只要知道它可用来抓包就行~)。

一、下载fiddler并且安装(电脑端)

1.fiddler官方链接:

https://www.telerik.com/download/fiddler

2.需要填写邮箱,照着网站的引导操作;下载后直接常规安装。

二、在fiddler中的两点设置(电脑端)

1.设置允许抓取HTTPS信息包

打开下载好的fiddler,Tools -> Options,然后再HTTPS的工具栏下勾选Decrypt HTTPS traffic,在新弹出的选项栏下勾选Ignoreserver certificate errors。

2.设置允许外部设备发送HTTP/HTTPS到fiddler

Tools-> Options,在Connections选项栏下勾选Allow remote computers to connect,并记住上面的端口号8888,后面会使用到。

三、得到网络的ip地址(电脑端)

1.注意:需要让电脑和手机处于同一个网络下,可使用wifi或者手机热点等来完成。

2.假如电脑和手机已经处于同一个网络之下,我们需要知道此网络的ip地址,可以在命令行(点击开始--运行--输入CMD--回车)输入ipconfig获得。

四、设置手机端(手机端操作)

1.打开手机找到手机wifi网络,并修改该wifi网络详情。

2.选择当前连接网络的更多信息,在苹果手机中是靠右边的一个叹号。

3.在最下面你会看到HTTP代理的选项,点击进入;进入后,填写上面记住的ip地址和端口号,确定保存。

五、下载fiddler安全证书并且证书信任(手机端操作)

1.下载fiddler证书

在手机上打开浏览器输入一个上面ip地址和端口号组成的url:http://192.168.1.215:8888,然后点击FiddlerRoot certificate下载fiddler证书。

2.证书信任

IOS不同系统对应的证书信任方法不同,IOS10.3/ISO11系统证书信任时设置路径为:设置--通用--关于本机--证书信任设置--(对应证书的开关)。

六、手机端抓包测试(手机端操作)

1.以“北京亲子年票”APP为例(小J曾赖此APP数据码字),爬取下图数据。

2.在手机上打开APP,在电脑端可以看到访问数据,右边是数据包申请得到的信息。爬取的数据可以保存成txt格式文件做后续处理。

另外,小J在做数据分析过程中的体会:爬取数据较易,整理数据较繁

需要将爬取的数据整理成结构化数据,这其中可以使用的工具包括EXCEL、python、R语言等,有机会小J再一一发文说明,可关注公众号持续关注哟。

想了解更多敬请关注订阅号

简单几步教你爬取IOS手机端APP数据相关推荐

  1. python-selenium自动爬取京东手机端全部类别数据----“从祖爬到孙”

    一.序言 大家好,我是小龙.今天我们不谈Java相关技术,想和大家分享一波我大学比赛时做项目使用的一个爬虫. 事情是这样的: 比赛项目有一个关于电商的模块,奈何没有数据,然后打算爬取京东,淘宝pc端数 ...

  2. Python爬虫:爬取华为应用市场app数据

    爬取华为应用商店的所有APP名称和介绍,因为页面数据是ajax异步加载的,所以要找到对应的接口去解析数据. 爬取华为应用市场app数据 一.分析网页 1. 分析主页 2. 分析appid 3. 分析u ...

  3. 网络爬虫中Fiddler抓取PC端网页数据包与手机端APP数据包

    1 引言 在编写网络爬虫时,第一步(也是极为关键一步)就是对网络的请求(request)和回复(response)进行分析,寻找其中的规律,然后才能通过网络爬虫进行模拟.浏览器大多也自带有调试工具可以 ...

  4. 手把手教你爬取途牛网旅行路线数据,告诉你五一去哪儿玩!

    作者 | timber 本文经授权转自数据森麟(ID: shujusenlin) 五一假期将至,送给大家一个用于途牛网爬取旅行线路线获取的爬虫,预祝大家都度过一个愉快的五一假期. 本爬虫最先是用 Sc ...

  5. Python 手把手教你爬取淘宝的笔记本电脑数据

      如果觉得文章写得好,如果你想要获取本文的所有数据,请关注公众号:[数据分析与统计学之美],添加作者[个人微信],进群和作者交流! 目录   1.selenium模块的安装与chromedriver ...

  6. 手把手教你爬取淘宝的笔记本电脑数据

      如果觉得文章写得好,如果你想要获取本文的所有数据,请关注公众号:[数据分析与统计学之美],添加作者[个人微信],进群和作者交流! 目录   1.selenium模块的安装与chromedriver ...

  7. Mac 抓取iOS手机端的crash日志操作

    iOS手机crash了,如何取出crash日志给研发定位呢! 第一步.iOS手机连接Mac信任验证 第二步.Mac端打开Xcode 第三步.打开Xcode之后,Mac的桌面的左上角就会变成英文,我们选 ...

  8. 简单几步教你制作植物攀爬到建筑上

    photoshop英文教程来自于:http://psd.tutsplus.com/articles/news/create-classic-ivy-running-up-a-building-psd- ...

  9. 100行代码教你爬取斗图网(Python多线程队列)

    100行代码教你爬取斗图网(Python多线程队列) 前言 根据之前写的两篇文章,想必大家对多线程和队列有了一个初步的了解,今天这篇文章就来实战一下,用多线程 + 队列 爬取斗图网的全网图片. 你还在 ...

  10. 【爬虫】Yhen手把手教你爬取表情包,让你成为斗图界最靓的仔!

    以下内容为本人原创,欢迎大家观看学习,禁止用于商业用途,转载请说明出处,谢谢合作! ·作者:@Yhen ·原文网站:CSDN ·原文链接:https://blog.csdn.net/Yhen1/art ...

最新文章

  1. PostgreSQL9.3中文手册的在线纠错
  2. pythonfile操作教程_Python基础教程之文件操作
  3. 老板居然让我用Java造假数据
  4. 【深度学习入门到精通系列】nnU-Net论文解析
  5. java B2B2C Springcloud多租户电子商城系统-Spring Cloud Sleuth
  6. ubuntu环境下如何解决svn提交出现can‘t check path ‘/home/...‘
  7. 无人驾驶、自动驾驶与驾驶辅助的区别
  8. 函数的重载、覆盖和隐藏
  9. 【转载】Linux平台软件包管理完全攻略
  10. 解决百度 ueditor v1.4.3 编辑器上传图片失真的bug?
  11. 蓝牙核心规范(V5.2)7.8-深入详解之SMP(安全管理协议)|LE配对过程(1)
  12. 开心消消乐简单的逆向破解过程
  13. opencv-contrib sfm扩展模块下载安装
  14. android刷机工具mac版,刷机精灵mac版
  15. Linux系统无网络安装nginx
  16. P3966 [TJOI2013]单词(AC自动机,Trie图)
  17. Consul注册中心注册的服务总是红叉 (All service checks failing)
  18. Ubuntu下使用FreeRadius实现Wifi认证
  19. 【Python】正则表达式re库
  20. python 基础代谢率计算_Python基础(五) BMR计算器demo

热门文章

  1. w ndows无法完成格式化,win10系统windows无法完成格式化的处理方法
  2. BZOJ4198: [Noi2015]荷马史诗(哈夫曼树)
  3. 伺服舵机四方运动程序以及角度确定
  4. win10硬盘读写速度测试-crystaldiskmark
  5. 为什么要学计算机演讲稿,我们为什么要学习科学演讲稿
  6. html调用js函数取随机返回数值并自动显示在html页面
  7. 利用浏览器书签执行脚本辅助
  8. html+css+js:文案馆网页设计
  9. php微信发送客服消息,微信公众号利用客服消息和模板消息实现微信群发
  10. kindle无缝迁移笔记