'''
爬取豌豆荚app数据spider_method:requests + bs4orseleniumurl:https://www.wandoujia.com/category/6001data:名称、详情页url、下载人数、app大小app_name, detail_url, download_num, app_size
'''from bs4 import BeautifulSoup
# 爬虫三部曲
# 1.发送请求
import requestsdef get_page(url):reponse = requests.get(url)# print(reponse.text)return reponse# 2.解析数据
import re
def parse_index(html):game_list = re.findall('<h2 class="app-title-h2"><a  href="(.*?)"  title="(.*?)" class="name">.*?</a>.*?<span class="install-count">(.*?)万人安装</span>  <span class="dot">・</span> <span title="(.*?)MB">.*?MB</span>',html,                 re.S)print(game_list)return game_list# 3.保存数据
def save_data(game):app_name, detail_url, download_num, app_size = gamedata = f'''=========欢迎=========游戏名称:{app_name}详情页url:{detail_url}下载人数:{download_num}万人app大小:{app_size}MB=========再见=========\n'''print(data)with open('wandoujia.txt', 'a', encoding='utf-8') as f:f.write(data)if __name__ == '__main__':# 拼接主页url = f'https://www.wandoujia.com/category/6001'print(url)# 1.往主页发送请求index_res = get_page(url)# 2.解析主页获取游戏信息game_list = parse_index(index_res.text)for game in game_list:# 3.保存数据# print(game_list)save_data(game)

转载于:https://www.cnblogs.com/ningshao/p/11129319.html

day03——抓取豌豆荚app数据相关推荐

  1. python抓取豌豆荚app数据信息

    一个哥们参加app大赛,我帮他写的抓取程序,但是好像抓取的数据挺少的,不知道怎么回事,先贴上来大家研究研究吧 # -*- coding: utf-8 -*- """ Cr ...

  2. day04 爬取豌豆荚app数据的两种方法

    今日内容:方法一 bs4爬取豌豆荚 爬取豌豆荚: 1.访问游戏主页 https://www.wandoujia.com/category/6001 2.点击查看更多,观察network内的请求 - 请 ...

  3. burpsuite抓取手机app数据包(通过笔记本开热点方式)

    burpsuite抓取手机app数据包(通过笔记本开热点方式) 1,点击笔记本右下方网络图标,出现移动热点,右键转到设置 进去之后设置热点名称密码,手机连接热点,笔记本查看连接设备的网段,这儿可以看到 ...

  4. Day04-爬取豌豆荚app数据

    今日内容: 一 爬取豌豆荚 爬取豌豆荚:     1.访问游戏主页         https://www.wandoujia.com/category/6001     2.点击查看更多,观察net ...

  5. Python爬虫+夜神模拟器+Fiddler抓取手机APP数据接口 -- 图文教程(霸霸看了都说好)

    Fiddler的抓包原理 Fiddler是强大的抓包工具,它的原理是以web代理服务器的形式进行工作的,使用的代理地址是:127.0.0.1,端口默认为8888,我们也可以通过设置进行修改. 代理就是 ...

  6. 使用Fiddler抓取手机APP数据包--360WIFI

    使用Fiddler抓取手机APP流量--360WIFI 操作步骤: 1.打开Fiddler,Tools-Fiddler Options-Connections,勾选Allow remote compu ...

  7. fiddler抓取手机app数据(手机开热点)

    一.准备工作 1. 下载并安装fiddler抓包工具.手机提前安装好fiddler证书,这个可以看以往的文章 二.手机配置 手机打开热点,电脑连接成功后 1.首先需要知道电脑ip地址.电脑ip地址可通 ...

  8. Fiddler抓取手机APP数据包

    https://my.oschina.net/jhao104/blog/605963 第一步:下载神器Fiddler,下载链接: http://w.x.baidu.com/alading/anquan ...

  9. Fiddler利用Xposed框架+JustTrustMe抓取手机APP数据

    文章目录 1. Xposed安装 2. JustTrustMe安装 3. 确保Fiddler在模拟器里配置 此文只是针对Fiddler抓取APP数据失败情况下的方案,主要想解决的是安卓手机APP抓包H ...

最新文章

  1. java项目测试支付异步通知接口
  2. windows 系统下多网卡绑定/绑定配置
  3. HTTP_REFERER的获取情况
  4. weka不能使用Apriori/FPGrowth
  5. 大剑无锋之介绍一下B+树【面试推荐】
  6. [收藏] 微软850位顶级人才不做Windows研发
  7. leetcode初级算法4.两个数组的交集 II
  8. leetcode初级算法1.删除排序数组中的重复项
  9. android studio 2.3 instant run,android studio 2.3 instant run not working
  10. Qt文档阅读笔记-Timer QML Type 官方解析与实例
  11. (花生壳)向日葵 相关虚拟硬件(驱动)造成 xp 系统无法正常 待机、休眠
  12. R语言轻巧的时间包hms
  13. miniusbpcb封装_MINI MICRO A型B型D型USB多类型Altium AD元件库 PCB封装库的电路方案详解...
  14. html 单击事件 隐藏/显示div
  15. python zip 压缩文件夹
  16. 连接真机开发安卓(Android)移动app MUI框架——混合式开发(一) (敲详细)
  17. 私域流量经济时代,商家如何打造属于你的店铺品牌私域流量池?
  18. 工地上的这些工种工资差距很大,你知道是哪些工种吗?
  19. 树莓派csi摄像头检测不到,没有/dev/video0,supported=0 detected=0等问题的解决方法
  20. JavaScript怎么获取当前时间的年月日?

热门文章

  1. 白嫖钉钉机器人-员工服务台
  2. ansible的play任务
  3. GPIO子系统需要掌握的重要概念
  4. 在来电监听服务中动态注册去电广播(BroadcastRecevier)
  5. 软件工程技术发展思索
  6. WKWebView高级使用
  7. Au 入门系列之七:应用效果器
  8. 全球与中国植物培养箱市场现状及未来发展趋势(2022)
  9. 基于webrtc的小型直播平台
  10. 金融科技:人行二代征信和百行征信接入方案