本文的例子使用requests抓取京东商城手机销售排行榜,并使用pyquery和CSS选择器提取相关的信息,同时将这些信息保存到Excel文件中。本例抓取总排行榜,并单独提取Apple、华为和小米手机的销售排行榜,将这些信息都保存在同一个Excel文件中,将这个Excel文件分成4个Sheet,第1个Sheet存储总排行榜,第2个Sheet存储Apple手机排行榜,第3个Sheet存储华为手机排行榜,第4个Sheet存储小米手机排行榜。

在京东商城首页(https://www.jd.com)用“手机”关键字进行搜索,会产生如下的URL。

https://search.jd.com/Search?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&psort=3&cid2=653&cid3=655&s=121&click=0

搜索界面如图1所示。

Python爬虫编程思想(70): 项目实战--抓取京东商城手机销售排行榜相关推荐

  1. Python爬虫编程思想(6):实战案例:抓取所有的网络资源

    Python爬虫编程思想(7):实战案例:抓取博客文章列表 到现在为止,我们已经对网络爬虫涉及到的基本知识有了一个初步的了解.本文会编写一个简单的爬虫应用,以便让读者对爬虫有一个基本的认识.本节要编写 ...

  2. python爬取app播放的视频,Python爬虫工程师必学——App数据抓取实战视频教程

    爬虫分为几大方向,WEB网页数据抓取.APP数据抓取.软件系统数据抓取.本课程主要为同学讲解如何用python实现App数据抓取,课程从开发环境搭建,App爬虫必备利器详解,项目实战,到最后的多App ...

  3. Python爬虫编程思想(1):HTTP基础

    目录 1. URI和URL 2. 超文本 3. HTTP与HTTPS 4. HTTP的请求过程 Python爬虫编程思想(2):客户端请求与服务端响应 由于网络爬虫要处理的主要目标是网页,所以在编写爬 ...

  4. Python爬虫 | 斗图网表情包抓取

    Python爬虫 | 斗图网表情包抓取 1.数据来源分析 2.制作div_list 3.发起请求 4.保存图片 5.批量获取 6.完整代码 声明 1.数据来源分析   打开斗图吧的主页,发现网址非常有 ...

  5. Python爬虫编程思想(86):项目实战--抓取豆瓣音乐排行榜

    本文的例子抓取了豆瓣音乐Top250排行榜.使用requests抓取相关页面,并使用Beautiful Soup的方法选择器和正则表达式结合的方式分析HTML代码,最后将提取出的数据保存到music. ...

  6. Python爬虫编程思想(103):项目实战--抓取QQ空间说说的内容

    本例使用Selenium完成一个综合项目,该项目可以QQ空间说说的内容.首先需要分析一下QQ空间说说的HTML代码. 由于进入QQ空间需要登录,所以抓取QQ空间说说的内容需要如下2步: 模拟登录 抓取 ...

  7. Python爬虫编程思想(133):项目实战--利用Appium抓取微信朋友圈信息

    本文利用Appium实现一个抓取微信朋友圈信息的爬虫.在编写爬虫之前,先要启动Appium服务器. 编写基于Appium的爬虫,关键就是分析App每个界面相关元素的特征,也就是如何获取这些元素,然后在 ...

  8. Python爬虫编程思想(48):项目实战:抓取起点中文网的小说信息

    本文会利用requests库抓取起点中文网上的小说信息,并通过XPath提取相关的内容,最后将经过提取的内容保存到Excel文件中.本例需要使用第三方的xlwt库,该库用来通过Python操作Exce ...

  9. Python爬虫编程思想(114):项目实战--使用Splash Lua抓取京东搜索结果

    本文会利用Splash Lua脚本在京东商城上搜索商品,然后抓取搜索出的商品名称,以及将每一页搜索结果的截图保存为PNG格式的文件. 本例的核心是使用select_all方法通过CSS选择器得到搜索页 ...

最新文章

  1. ceph osd混合部署和普通部署
  2. matlab直流输电,重金悬赏matlab编程(电力方向,轻型高压直流输电的小信号模型)...
  3. java浏览器实验报告_关于java实验报告模板
  4. spring— Spring与Web环境集成
  5. 【SpringMVC 笔记】SpringMVC 原理 + 入门项目(xml 配置版 vs 注解版)
  6. html 上标下标 特殊字符等
  7. Android PDF文件阅读方案
  8. DB2 数据库密码过期
  9. wz框架登录功能详解——demo1
  10. 前端技术学习记录:react+dvajs+ant design实现暴走计算器的页面重构(二)
  11. Tengine全面支持寒武纪思元芯片平台,共同推进AI芯片加速之路
  12. 业内人士坦言——猎头公司做不大
  13. 最小二乘法多项式曲线拟合数学原理及其C++实现
  14. 音频编码之opus(一)
  15. HTTP 错误 404.17 - Not Found 请求的内容似乎是脚本,因而将无法由静态文件处理程序来处理。
  16. 机器学习入门必须掌握的8个关键词知识
  17. 优化问题-GP(几何规划,Geometric Program)
  18. [Unity] unity中对象池的使用
  19. 虚拟现实技术是综合利用计算机图形学等,虚拟现实技术与图形学
  20. 通过短信猫发送手机短信

热门文章

  1. 高逼格的年终总结怎么写?这是我见过最系统的写法
  2. Python数据分析之pandas(保姆级教程)
  3. c语言 pow和sqrt注意
  4. MySQL数据库引擎、数据事务与隔离级别
  5. win10计算机本地无法连接,win10系统电脑本地连接不见了解决方法
  6. C++ 简化 推箱子 小游戏 完整代码 参考网络资料 命令行运行 仅供初学者参考交流
  7. 简练软考知识点整理-建设网络强国
  8. 大數據環境搭建,數據採集,數倉環境準備(hive on spark) 01
  9. 第1关:小球自由落体运动-------C语言程序设计技术(循环结构程序设计1)
  10. 随机过程 自相关函数 互相关函数自协方差矩阵 互协方差矩阵的区别联系