爬取京东商城的图片

1.我们爬取数据时首先自己要明确需要什么,我们在爬取京东商城的图片是首先要获取url,打开京东网页,点击手机类型,选择全部手机,观察浏览器的地址栏的变化,发现url主要是有:https://list.jd.com/list.html?cat=9987,653,655&page=1,而page就是每页的标志.

2.点击F12,通过浏览器查看部分源代码,寻找特需规律,我们发现每一页开始都是从

开始的,以

结束的,接着查看图片的规律,,那我们就可以根据这个规律来写正则表达式来过滤我们想要的信息。

def craw(url, page):

# 1.获取网页的数据

html1 = urllib.request.urlopen(url).read()

html1 = str(html1)

# 2.通过正则得到每页图片的数据

pattrn1 = '

'

result1 = re.compile(pattrn1).findall(html1)

image = result1[0]

# 3.在通过正则拿到每页所有的图片链接

pattrn2 = ''

imaglist = re.compile(pattrn2).findall(image)

# 4.遍历所有的图片链接,将图片保存在本地,通过页号和序号有序的排列

x = 1

for imageurl in imaglist:

imagename = "D:/python/image"+str(page)+str(x)+".jpg"

imageurl = "http://"+imageurl

try:

urllib.request.urlretrieve(imageurl, filename=imagename)

except urllib.error.URLError as e:

if hasattr(e, "code"):

x += 1

if hasattr(e, "reason"):

x += 1

x += 1

for i in range(1, 79):

url = "https://list.jd.com/list.html?cat=9987,653,655&page="+str(i)

craw(url, i)

其实爬虫的关键是在于分析,我们要根据自己的需求对网页及西宁分析,然后找出规律,写出正确的正则表达式来过滤自己的信息,拿到想要的东西,在就是在请求的过程中我们需要注意许多细节。

python爬取京东商品图片_Python---爬取京东商城的图片相关推荐

  1. python爬虫爬取京东商品评价_python爬取京东商品信息及评论

    ''' 爬取京东商品信息: 功能: 通过chromeDrive进行模拟访问需要爬取的京东商品详情页(https://item.jd.com/100003196609.html)并且程序支持多个页面爬取 ...

  2. python爬取京东商品价格走势_python抓取京东价格分析京东商品价格走势

    代码如下: from creepy import Crawler from BeautifulSoup import BeautifulSoup import urllib2 import json ...

  3. 京东商品详情页API接口、京东商品销量API接口、京东商品列表API接口、京东APP详情API接口、京东详情API接口,京东SKU信息接口

    京东商品详情页API接口.京东商品销量API接口.京东商品列表API接口.京东APP详情API接口.京东详情API接口,京东SKU信息接口,通过商品ID提取商品详情页各项数据,包含商品标题,sku i ...

  4. 京东商品详情页API接口、京东详情API接口、京东商品销量API接口、京东商品列表API接口、京东APP详情API接口、京东SKU信息接口,京东API接口

    通过商品ID或是商品url中的商品ID调用提取京东商品详情页API接口.京东商品销量API接口.京东商品列表API接口.京东APP详情API接口.京东详情API接口,京东SKU信息接口拿到商品详情页各 ...

  5. python爬取京东商品代码_Python简单爬取京东商品列表

    #!/usr/bin/python3 # -*- coding: UTF-8 -*- import urllib.request import urllib.error import re impor ...

  6. python treeview底部加个按钮_Python爬取京东商品信息(GUI版本)

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:DYblog 转载:https://www.cnblogs.com/ ...

  7. python爬取商品信息_python爬取商品信息

    原博文 2014-11-27 02:09 − 老严要爬某网购网站的商品信息,正好我最近在学python,就一起写了一个简单的爬虫程序. 需求:某网的商品信息,包括商品名,市场价和售价 工具:pytho ...

  8. python爬取千图网_python爬取lol官网英雄图片代码

    python爬取lol官网英雄图片代码可以帮助用户对英雄联盟官网平台的皮肤图片进行抓取,有很多喜欢lol的玩家们想要官方的英雄图片当作自己的背景或者头像,可以使用这款软件为你爬取图片资源,操作很简单, ...

  9. python爬虫知乎图片_python 爬取知乎图片

    先上完整代码 1 importrequests2 importtime3 importdatetime4 importos5 importjson6 importuuid7 from pyquery ...

  10. python爬取虎扑评论_Python爬取NBA虎扑球员数据

    虎扑是一个认真而有趣的社区,每天有众多JRs在虎扑分享自己对篮球.足球.游戏电竞.运动装备.影视.汽车.数码.情感等一切人和事的见解,热闹.真实.有温度. 受害者地址 https://nba.hupu ...

最新文章

  1. Mybatis报错ClassNotfind
  2. SQL SERVER类型与C#类型对照
  3. 这样做,RMAN备份速度可提高6倍!
  4. linux mysql 修改root密码_MySQL忘了root密码,如何修改?
  5. 机器学习之K-近邻算法
  6. java工厂模式和抽象工厂_Java中的抽象工厂设计模式
  7. 震精 - PostgreSQL 递归查询 - 树型数据按路径分组输出
  8. Oracle OCP题库变了,052全新题库收集整理-30
  9. 干货 | 推荐几款实用的思维导图工具
  10. Linux/Ubuntu 98版五笔安装
  11. 心电算法(Discuss of ECG Analysis Algorithm)
  12. 三秒让你学会公私网地址转换(NAT)
  13. 关于this.name=name的理解
  14. 你是去上大学,别让大学上了你
  15. 如何跨域调用微信图片
  16. springCloud与它的好兄弟微服务
  17. 请编写一个程序,使用字典存储学生信息,学生信息包含学号和姓名,请根据学生学号从小到大输出学生信息
  18. 笔记本插入麦克风被识别成耳机怎么办
  19. GUI 图形用户界面编程(十一)-扑克界面设计
  20. 思科 网络安全 考试期末

热门文章

  1. 【ERP软件】ERP体系二次开发有哪些危险?
  2. 应届生应聘软件开发岗位推荐书籍
  3. Maven聚合SSM项目(八)
  4. brew search怎么看版本_brew 查看已安装软件
  5. PS怎么把图片处理的更清晰
  6. 云流化如何实现多人线上协作的?
  7. mysql下载不是运作宝教程_魔力宝贝私服架设教程
  8. 2017年美团校招 拼凑钱币
  9. 熊猫烧香被恶搞,网友爆笑诗词句大集合
  10. 服务器维保价格标准_标准维护服务方案