本文介绍两种抓取价格的方法

1、读取接口获取价格 scrapy等等。。简单

2、基于模拟浏览器读取页面抓取selenium 简单

京东商品价格目前是基于api接口获取然后通过js进行数值初始化

一、基于selenium模拟浏览器进行抓取

In [11]: from selenium import webdriver

In [12]: drive = webdriver.PhantomJS()

In [13]: driver.get("https://item.jd.com/12608054023.html")

In [14]: driver.find_element_by_class_name("price").text

Out[14]: u'119.00'

In [15]: driver.find_element_by_class_name("p-price-plus").text

Out[15]: u'\uffe5109.00'

In [16]: print driver.find_element_by_class_name("p-price-plus").text

¥109.00

In [17]: driver.find_element_by_class_name("p-price").text

Out[17]: u'\uffe5119.00'

In [18]: print driver.find_element_by_class_name("p-price").text

导入到BeautifulSoup处理

from bs4 import BeautifulSoup as bs

pageSource = driver.page_source

bsobj = bs(pageSource)

print bsobj.find('span',{'class':'p-price'}).get_text()

二、基于scrapy抓取方式

1、爬取价格

http://p.3.cn/prices/mgets?skuIds=J_12608054023,J_&type=1

其中12608054023是商品的id

返回的是个json格式的数据如下:

其中p对应的就是商品价格

2、爬取评论

http://club.jd.com/productpage/p-12608054023-s-0-t-3-p-0.html

其中12608054023是商品的id

返回的是个json格式的数据

其中有商品数量和评价信息

scrapy shell https://p.3.cn/prices/get\?skuid\=J_11896401

import json

data = json.loads(response.body)

print data[0].get('p')

python 京东 价格_python抓取京东商品价格相关推荐

  1. python京东价格_python抓取京东价格分析京东商品价格走势

    代码如下: from creepy import Crawler from BeautifulSoup import BeautifulSoup import urllib2 import json ...

  2. python爬取京东图书_Python抓取京东图书评论数据

    Python抓取京东图书评论数据 来源:中文源码网    浏览: 次    日期:2018年9月2日 [下载文档:  Python抓取京东图书评论数据.txt ] (友情提示:右键点上行txt文档名- ...

  3. python爬取京东手机参数_python抓取京东小米8手机配置信息

    本文代码是使用python抓取京东小米8手机的配置信息 首先找到小米8商品的链接:https://item.jd.com/7437788.html 然后找到其配置信息的标签,我们找到其配置信息的标签为 ...

  4. 基于python的scrapy爬虫抓取京东商品信息

    这是上的第二节爬虫课程的课后作业:抓取京东某类商品的信息,这里我选择了手机品类. 使用scrapy爬虫框架,需要编写和设置的文件主要有phone.py , pipelines.py , items.p ...

  5. python iphone 爬虫_python爬取京东所有iphone的价格和名称

    原本想升一下级,用一下creep神马的,但是正则今天突然出了点小问题,我就生气了,就用正则抓取了一下. 这个正则可以用re.search 或者 re.findall都可以,我比较喜欢用search因为 ...

  6. python京东商品_Python爬取京东的商品分类与链接

    前言 本文主要的知识点是使用Python的BeautifulSoup进行多层的遍历. 如图所示.只是一个简单的哈,不是爬取里面的隐藏的东西. 示例代码 from bs4 import Beautifu ...

  7. 用python画苹果_Python爬取京东Iphone X用户评论并绘制词云

    目标爬取京东商城上iPhone X用户评论数据: 使用jieba对评论数据进行分词处理: 使用wordcloud绘制词云图. 目前京东商城只会展示商品的前100页评论,所以我们能爬取到的评论只有100 ...

  8. python行业中性_Python抓取分析淘宝连衣裙数据,128元真的是低价人群分界线吗?...

    1.我是一个低价人群用户 上周发表文章<一个匿名用户的淘宝"连衣裙"大观>后,交流群里面很热闹地讨论了起来,小伙伴们都在秀自己的淘宝连衣裙搜索价格,相较于小伙伴们搜索出 ...

  9. python喜马拉雅收费_python抓取喜马拉雅免费专辑

    老规矩,先上代码 import requests import os import urllib # json文件地址 json_url = "https://www.ximalaya.co ...

最新文章

  1. 关于你,关于我. 你好 5G
  2. 【HDU - 薛猫猫杯程序设计网络赛】【题解】
  3. 常见的技术类英文字母含义总结,Localhost、SDK、URL 等(持续更新中)
  4. python docx 字体大小_Python操作Word的入门教程
  5. Spring MVC学习总结(13)——Spring MVC集成Swagger时文档无法排序问题
  6. 小议使用“完整”的CSS的缺点
  7. 教你轻松玩转天线效应(Process Antenna Effect)
  8. cropper.js使用
  9. 三星手机android版本怎么升级,如何在三星Galaxy手机上更新软件
  10. 2019云栖大会归来有感
  11. c语言:24、大小端序
  12. turtle递归作图绘制谢尔宾斯基地毯【详解】
  13. win10修改用户名(中文用户改为英文名)切换administrators管理员用户
  14. 打造现代应用的利器,VMware Tanzu显露王者风范 (1)
  15. VR光学设计的关键参数
  16. this.$router.push方法,父子如何传值和接收值
  17. Leetcode:面试题 01.06. 字符串压缩
  18. 乐鑫esp8266学习rtos3.0笔记第4篇:带你捋一捋微信公众号 airkiss 配网 esp8266 并绑定设备的过程,移植并成功实现在 esp8266 rtos3.1 sdk。(附带demo)
  19. iphone 12屏幕材质 iPhone12尺寸多大
  20. 电影《摔跤吧!爸爸》观后感

热门文章

  1. cpu占用突然到百分百又降下去_CPU占用百分百是怎么回事?
  2. ArcGIS教程:填挖方的工作原理
  3. 秦朔-王坚:不理解在线,就没有真懂互联网
  4. 第九篇,const指针,strlen,strcpy和strcmp函数的详细讲
  5. 《黑客之道》--网络安全 黑客攻防教程 渗透测试 利用第三方服务对目标进行被动信息收集防止被发现
  6. MTK软件测试简历,【转帖】MTK]平台相关资料
  7. 浙江省计算机专业专科院校排名,浙江省高职院校“五强”
  8. 反欺诈概念库-信用卡反欺诈管理
  9. Qt利用QtXlsx操作excel文件
  10. ROS Qt环境的搭建及基础知识介绍