开篇

这个博客挂了两天,现在补上,首先是下载的链接手机评论,数据我保存成了json格式,我大概爬取了以下几个手机品牌的评论,由于京东一般过万的评论都只显示前一千多条,所以下面的每条都在一千条左右,我想正常的分析应该是足够了

这边的话,如果你想爬取其他商品的评论,也可以参照我的另外一篇博客,里面详细地介绍了爬取的过程,也放出了相应的代码,有兴趣的话可以自己尝试着实现一下,其实也就那么回事。

数据集

首先是数据集的读取

In [1]: import jsonIn [2]: with open('Desktop/手机评论数据集/oppo_r15.json','r') as f:...:     data = json.load(f)

看一下数据集里面都是一些什么内容

In [4]: type(data)
Out[4]: listIn [5]: test = data[0]In [6]: type(test)
Out[6]: dictIn [7]: test.keys()
Out[7]: dict_keys(['userExpValue', 'replyCount', 'userProvince', 'replies', 'anonymousFlag', 'plusAvailable', 'isMobile', 'score', 'content', 'userLevelColor', 'isReplyGrade', 'imageCount', 'showOrderComment', 'referenceImage', 'referenceName', 'userLevelName', 'userImgFlag', 'isTop', 'userLevelId', 'mobileVersion', 'referenceTypeId', 'topped', 'referenceType', 'firstCategory', 'thirdCategory', 'status', 'mergeOrderStatus', 'productSize', 'integral', 'productColor', 'afterDays', 'nickname', 'userClient', 'guid', 'days', 'referenceId', 'images', 'orderId', 'userClientShow', 'discussionId', 'productSales', 'id', 'creationTime', 'title', 'userImageUrl', 'uselessVoteCount', 'viewCount', 'userImage', 'usefulVoteCount', 'videos', 'secondCategory', 'recommend', 'referenceTime'])

data是一个列表,里面里面的每一个元素代表的就是一整条用户的评论以及其他信息,相信这些信息做推荐的时候也是用的上的,具体的信息如上所示的代码。那怎么找出我们的评论呢?请看下面的代码

In [8]: test['content']
Out[8]: '各方面都按苹果X的标准做处理!后壳玻璃,紫色玻璃渐变效果非常好!很酷,这价位值。系统上,虽然4G的运存,一点也未觉卡。相机的夜拍果的确很好,2千万不是吹牛的,赞!值得一提的的是知能ai,要慢慢去尝试,有好多便捷的手势都是未曾接触过的!'
In [9]: test['score']
Out[9]: 5

ok,具体内容就是这样。

京东手机评论数据集介绍相关推荐

  1. python数据采集课设-京东手机评论爬取与分析

    数据采集模块: 1.手机评论采集,数据信息(评论,评分,用户,评论发布时间) 爬取不同的手机评论,需要设置不同的id 如上图红圈处即为手机vivo S12的id import requests imp ...

  2. 京东手机评论分析(一):词云

    开篇 先做一些简单的评论分析吧,大部分还是借助于不同的python工具,不得不说很多中文的基本任务还是做得效果比较一般的,毕竟中文的复杂程度可不是英文可以比拟的,这篇就是简单地生成一个词云,是以词频为 ...

  3. python批量评论_python批量爬取京东手机评论信息及星级

    本科生在读,如有问题欢迎指正 爬取京东评论信息:评论信息是动态加载的,所以在商品详情页不能直接爬取评论. 下面以一款手机为例,详细介绍python批量爬取京东评论. 找到评论区域 image.png ...

  4. 京东手机评论数据挖掘之二:情感分析

    用Naive Bayes方法对识别出的新词做情感极性评分,得到的结果: Postive: http://121.89.176.173/emot_new_gd.html Negtive: http:// ...

  5. 基于IMDB评论数据集的情感分析

    文章目录 前言 一.大型电影评论数据集介绍 二.环境配置 三.实验模型及流程 1.实验模型 2.实验流程 四.实验代码 1.多层感知器模型代码 2.递归神经网络模型代码 3.长短期记忆模型代码 五.实 ...

  6. 爬取了京东商城上的部分手机评论数据,仅供学习使用

    京东的手机评论数据爬虫,仅供学习使用 说明 爬取了京东商城上的部分手机评论数据.由于项目的数据量要求不大,仅仅采用了比较简单的方式来进行数据的爬取,过程分为两个部分: 根据不同的手机品牌选择了第一页的 ...

  7. 京东华为P20手机评论数据抓取

    用selenium 和chromedriver抓取京东手机P20的评论信息 import time from selenium import webdriver import csv from lxm ...

  8. 【机器学习】京东用户购买意向预测-数据集介绍和数据清洗 - 1

    主题:京东用户购买意向预测 数据集: 这里涉及到的数据集是京东最新的数据集: JData_User.csv 用户数据集 105,321个用户 JData_Comment.csv 商品评论 558,55 ...

  9. NEO4J搭建京东手机类小型知识图谱

    说明:本人在知乎上也发布了这边文章,所以这里直接就转载那边的图片了,链接如下:https://zhuanlan.zhihu.com/p/77034128 本次搭建的小型知识图谱包括具体手机的分类信息和 ...

  10. 京东商品评论的分类预测与LSA、LDA建模

    (一)数据准备 1.爬取京东自营店kindle阅读器的评价数据,对数据进行预处理,使用机器学习算法对评价文本进行舆情分析,预测某用户对本商品的评价是好评还是差评.通过数据分析与模型分析,推测出不同型号 ...

最新文章

  1. ASP.NET 发邮件方法
  2. linux命令使用全集
  3. linux docker漏洞,安装shadow或linux-pam的Alpine Linux Docker镜像有漏洞,附解决
  4. StringBuilder初始化容量以及扩容机制(源码分析)
  5. oracle中的符号含义
  6. 阿里大淘系模型治理阶段性分享
  7. 二级C语言操作例题(十六)
  8. 苹果在中国失掉 iPad 商标
  9. 评论(评价)数据库表的设计
  10. 硬盘数据恢复:自己在家修复你的硬盘只需要5分钟就够了
  11. linux格式化4t硬盘分区,详解:Linux 硬盘,格式化,分区 详解
  12. CSS3新增的选择器有哪些?
  13. 显控一体机选型_显控一体机_显之研
  14. 【SQL】cumt 数据库平台实践
  15. Report Painter学习记录
  16. ajax 泛微oa表单js_接口调用示例
  17. android中的单例模式,Android中的单例模式
  18. 微信Banner广告位置设置
  19. 使用github API的简单github个人资料页面显示应用程序,以及使用bloc模式的flutter...
  20. abap文件上传与下载

热门文章

  1. 如何在Windows11安装安卓子系统?
  2. 【No.01】八份简约经典的生成设计入门案例
  3. 初次见面——C语言的整体把握【小白福音】
  4. 初级使用xenu,windows10系统安装完无法运行
  5. Unity 3D——打包复用资源(.unitypackage文件)
  6. 《mysql必知必会》学习笔记
  7. 菜鸟学算法--二分查找
  8. requests关于Exceeded 30 redirects
  9. debian 7 网络安装后无法联接wifi
  10. 是谁在觊觎娱乐圈站点?揭秘神秘黑客组织-黑界