前言
最近一直在奋战爬虫,对我而言,我感觉比较好玩,刚开始也处于迷糊状态,但现在对于爬虫的基本流程也渐渐熟悉了,也没来得及整理,今天整理的是爬取京东手机Apple iPhone XS的评论。
首先
找到你所要爬取物品的页面,右键检查,如图所示:

然后按以下操作:

当你点击Network之后然后滑动商品页面并点击商品评论:你会发现多了几行数据,不用说多出来的这几行肯定有评论的数据,但是我们还是很难找到。
但是我们可以猜测一下商品评论的名字,一般情况下都是有comments,因此我们ctrl+f搜索:

点开之后发现这应该就是我们需要的数据了:

当你点开上面数据是:

看内容我们算是找对了
然后(开始请求和寻找cookie)



我们需要的就是红方块框柱的内容了。
**最后(我感觉可以直接上代码了)
**`

import requests
import json
import csv
from lxml import etreecomment_url = 'https://sclub.jd.com/comment/productPageComments.action?callback'for i in range(10):page = iparams = {'productId': 100000287113,  # 商品id,先写死'score': 0,'sortType': 5,'page': page,'pageSize': 10,# 'callback': 'fetchJSON_comment98vv15262',# 'isShadowSku': 0,# 'fold': 1}headers = {'cookie': 'shshshfpa=4e6c0f90-587c-a46f-5880-a7debd7d4393-1544616560; __jdu=1126324296; PCSYCityID=412; user-key=44089d07-befa-4522-87fc-bcc039ec7045; pinId=qopcdCj6kcR3U84v0KTTbrV9-x-f3wj7; pin=jd_769791719e9e9; unick=jd_769791719e9e9; _tp=nc%2FbpB%2BkeSbk3jZ6p2H0FlWrdUa1gbgi16QiQ7NBXKY%3D; _pst=jd_769791719e9e9; cn=9; ipLoc-djd=1-72-2799-0; mt_xid=V2_52007VwMSUVpaUV8cQR5sUWMDEgUIUVBGGEofWhliABNUQQtQWkpVHVVXb1ZGB1lYW11LeRpdBW4fElFBW1VLH0ESXgJsAhpiX2hSahxLGFsFZwcRUG1bWlo%3D; shshshfpb=bRnqa4s886i2OeHTTR9Nq6g%3D%3D; unpl=V2_ZzNtbUZTSxJ3DURTLk0LAmJXFVlKAkdAIQ1PUXseCVIzU0UKclRCFXwURldnGlUUZwcZXERcQRdFCHZXchBYAWcCGllyBBNNIEwHDCRSBUE3XHxcFVUWF3RaTwEoSVoAYwtBDkZUFBYhW0IAKElVVTUFR21yVEMldQl2VHsaWwdkBhFVRWdzEkU4dl17HVwDYDMTbUNnAUEpAUJRfRpcSGcDEVpAVEYWfQ92VUsa; __jda=122270672.1126324296.1544405080.1545968922.1545980857.16; __jdc=122270672; ceshi3.com=000; TrackID=11EpDXYHaqwJE15W6paeMk_GMm05o3NUUeze9XyIcFs33GGxX8knxMpxWTeID75qSiUlj31s8CtKJs4hJUV-7CvKuiOEyDd8bvOCH7zzigeI; __jdv=122270672|baidu-pinzhuan|t_288551095_baidupinzhuan|cpc|0f3d30c8dba7459bb52f2eb5eba8ac7d_0_55963436def64e659d5de48416dfeaff|1545980984854; 3AB9D23F7A4B3C9B=OA3G4SO3KYLQB6H3AIX36QQAW34BF376WJN66IUPEQAG6FUA2NWGM6R6MBDL32HLDG62WL2FICMYIVMOU6ISUWHKPE; shshshfp=1ed96ad08a7585648cd5017583df22bd; _gcl_au=1.1.162218981.1545981094; JSESSIONID=305879A97D4EA21F4D5C4207BB81423F.s1; shshshsID=c8c51ee0c5b1ddada7c5544abc3eea8a_5_1545981289039; __jdb=122270672.11.1126324296|16.1545980857; thor=3A30EBABA844934A836AC9AA37D0F4B85306071BD7FC64831E361A626E76F6977EC7794D06F2A922AEABF7D3D7DC22FBE2EB6B240F81A13F5A609368D4185BA0081D7C34A93760063D2F058F5B916835B4960EC8A9122008745971D812BA9E4AE48542CCC5A42E5CD786CC93770E520E36F950614C06A7EB05C8E1DD93EEA844B2EBA9B0136063FCFB6B7C83AECA828774041A9FED7BD98496689496122822FF','referer': 'https://item.jd.com/100000287113.html','user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36'}comment_resp = requests.get(url=comment_url, params=params, headers=headers)print(comment_resp.status_code)# print(comment_resp.text)comment_str = comment_resp.textcomment_dict = json.loads(comment_str)comments = comment_dict['comments']for comment in comments:user = comment['nickname']color = comment['productColor']size = comment['productSize']test = comment['content']with open('JDcotent.csv', 'a', newline='') as f:row = ('买家', '商品颜色', '版本', '评论')writer = csv.writer(f)writer.writerow(row)# print(infor)with open('JDcotent.csv', 'a', newline='')as csv_file:rows = (user,color,size,test)writer = csv.writer(csv_file)writer.writerow(rows)

这是没有函数封装的代码(刚开始练手的)后续会添上整理好的函数封装并存入数据库的代码。

爬取京东某商品评论并存入csv相关推荐

  1. mysql好评中评统计_scrapy爬取京东笔记本及评论信息存入MySQL数据库

    爬取思路 1.分析页面,定义爬取字段 2.观察网页,分析接口url,通过xpath和json解析爬取内容字段 3.在pipelines.py写入存储方式 4.开始爬取 5.GitHub地址:https ...

  2. Python爬取京东任意商品数据实战总结

    利用Python爬取京东任意商品数据 今天给大家展示爬取京东商品数据 首先呢还是要分思路的,我分为以下几个步骤: 第一步:得到搜索指定商的url 第二步:获得搜索商品列表信息 第三步:对得到的商品数据 ...

  3. python爬取京东商品图片_python利用urllib实现爬取京东网站商品图片的爬虫实例

    本例程使用urlib实现的,基于python2.7版本,采用beautifulsoup进行网页分析,没有第三方库的应该安装上之后才能运行,我用的IDE是pycharm,闲话少说,直接上代码! # -* ...

  4. selenium/requess爬取京东手机商品的详细信息1~selenium练习版

    selenium/requess爬取京东手机商品的详细信息1~selenium!! 前言 因为我也是个学生,所以代码可能会有点繁琐,我们都是超能100,一点点积累进步,其实有很多的地方可以简化,因为我 ...

  5. python爬取京东网页商品实例(一)

    # Copyright (c)2018, 东北大学软件学院学生 # All rightsreserved # 文件名称:justForTest.py # 作 者:孔云 #问题描述:打开京东页面,选取一 ...

  6. python爬取当当网商品评论

    python爬取当当网商品评论 本案例获取某鞋评论作为例 案例目的: 通过爬取当当网商品评价,介绍通过结合jsonpath和正则表达式获取目标数据的方法. 代码功能: 输入爬取的页数,自动下载保存每页 ...

  7. python爬取苏宁商品评论

    python爬取苏宁商品评论 爬取其他电商物品评论的案例如下: https://blog.csdn.net/coffeetogether/article/details/114296159 https ...

  8. 用selenium爬取京东平台商品列表,爬取商品名称、价格、店铺信息

    #用selenium爬取京东平台商品列表,爬取商品名称.价格.店铺信息from selenium import webdriver from selenium.webdriver.common.by ...

  9. Python爬虫教程:Python爬取京东商城商品大图详解

    Python爬取京东商城商品大图详解 做为一个爬虫初学者,在做爬取网址图片的练习中以京东网为例爬取商品大图并保存在相应的文件夹 1.导入模块 import urllib.request import ...

  10. Scrapy练习——爬取京东商城商品信息

    刚刚接触爬虫,花了一段时间研究了一下如何使用scrapy,写了一个比较简单的小程序,主要用于爬取京东商城有关进口牛奶页面的商品信息,包括商品的名称,价格,店铺名称,链接,以及评价的一些信息等.简单记录 ...

最新文章

  1. 今天浅谈功能测试基础
  2. 搜狗拼音输入法新加词库的基本使用
  3. 解构电商产品——订单系统(一)
  4. C++brent method布伦特方法找extrema极值的算法(附完整源码)
  5. 怎么判断前轮左右的位置_如何判定汽车前面左右轮的位置?大家有什么经验?...
  6. IntelliJ IDEA创建web项目及异常问题解决
  7. 求助:关于sql如何统计时间的问题
  8. spring boot简介_Spring Boot简介
  9. linux端口爆破软件,Linux网络安全:端口扫描软件 nmap
  10. realme GT大师版核心参数曝光:同样一亿像素主摄
  11. Dijkstra算法的C语言程序
  12. 代码设计的几个基础技巧
  13. 《剑指offer》第二十三题(链表中环的入口结点)
  14. django:自动生成接口文档
  15. 如何将图片批量转换成PDF?
  16. 7个实用有效的shopify运营策略,跨境电商卖家必知
  17. 戴尔惠普联想笔记本性价比(戴尔和联想笔记本性价比)
  18. 百度联盟百青藤app流量变现
  19. 常见的Altium操作
  20. ArcGIS基础实验操作100例--实验66符号图层的保存与加载

热门文章

  1. debian中双网卡上内外网的设置方法
  2. livezilla账号或密码修改方法
  3. 遥感数据相关资源获取
  4. 注塑成型工艺流程四大知识点总结
  5. php 降低采样率,讨论采样频率、采样深度(位深)、音量调节对音质的影响
  6. kali安装小企鹅输入法
  7. 蓝桥杯2020年第十一届省赛真题-走方格-java
  8. 生产环境部署springcloud微服务启动慢的问题排查
  9. 百度导航引擎初始化失败问题解决
  10. linux服务器之间的文件同步(双向同步unison+inotify)