现如今各种APP、微信订阅号、微博、购物网站等网站都允许用户发表一些个人看法、意见、态度、评价、立场等信息。针对这些数据,我们可以利用情感分析技术对其进行分析,总结出大量的有价值信息。例如对商品评论的分析,可以了解用户对商品的满意度,进而改进产品;通过对一个人分布内容的分析,了解他的情绪变化,哪种情绪多,哪种情绪少,进而分析他的性格。怎样知道哪些评论是正面的,哪些评论是负面的呢?正面评价的概率是多少呢?

利用python的第三方模块SnowNLP可以实现对评论内容的情感分析预测,SnowNLP可以方便的处理中文文本内容,如中文分词、词性标注、情感分析、文本分类、提取文本关键词、文本相似度计算等。大概大于等于0.5,可以判断为正面评价——积极情感,小于0.5,可以判断为负面评价——消极情感。

下面分析一组京东上某产品的评论数据并生成折线图:

部分源数据:

实现过程:

#加载情感分析模块

from snownlp import SnowNLP

#from snownlp import sentiment

import pandas as pd

import matplotlib.pyplot as plt

#导入样例数据

aa ='F:\\python入门\\python编程锦囊\\Code(实例源码及使用说明)\\Code(实例源码及使用说明)\\Code(实例源码及使用说明)\\09\\data\\京东评论.xls'

#读取文本数据

df=pd.read_excel(aa)

#提取所有数据

df1=df.iloc[:,3]

print('将提取的数据打印出来:\n',df1)

#遍历每条评论进行预测

values=[SnowNLP(i).sentiments for i in df1]

#输出积极的概率,大于0.5积极的,小于0.5消极的

#myval保存预测值

myval=[]

good=0

bad=0

for i in values:

if (i>=0.5):

myval.append("正面")

good=good+1

else:

myval.append("负面")

bad=bad+1

df['预测值']=values

df['评价类别']=myval

#将结果输出到Excel

df.to_excel('F:\\python入门\\python编程锦囊\\Code(实例源码及使用说明)\\Code(实例源码及使用说明)\\Code(实例源码及使用说明)\\09\\data\\result2.xls')

rate=good/(good+bad)

print('好评率','%.f%%' % (rate * 100)) #格式化为百分比

#作图

y=values

plt.rc('font', family='SimHei', size=10)

plt.plot(y, marker='o', mec='r', mfc='w',label=u'评价分值')

plt.xlabel('用户')

plt.ylabel('评价分值')

# 让图例生效

plt.legend()

#添加标题

plt.title('京东评论情感分析',family='SimHei',size=14,color='blue')

plt.show()

Excel结果:

作图的结果:

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

python爬虫实例电商_Python实现爬取并分析电商评论相关推荐

  1. 利用python分析电商_Python实现爬取并分析电商评论

    现如今各种APP.微信订阅号.微博.购物网站等网站都允许用户发表一些个人看法.意见.态度.评价.立场等信息.针对这些数据,我们可以利用情感分析技术对其进行分析,总结出大量的有价值信息.例如对商品评论的 ...

  2. python爬虫表格数据匹配_python,爬取数据做成表格,解放你的双手

    前言 爬取豆瓣的 top250 电影榜 环境 请自行 安装python 需要的包 BeautifulSoup MySQL-python 开始 创建一个py文件 demo3.py 分析页面结构 ![im ...

  3. python 爬虫实例-python爬虫实例,一小时上手爬取淘宝评论(附代码)

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 1 明确目的 通过访问天猫的网站,先搜索对应的商品,然后爬取它的评论数据. ...

  4. Python爬虫实例,一小时上手爬取淘宝评论(附代码)!

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 1 明确目的 通过访问天猫的网站,先搜索对应的商品,然后爬取它的评论数据. ...

  5. python爬虫实例——session自动登录并爬取相关内容

    1.理解下 session (会话) 所谓的会话,你可以理解成我们用浏览器上网,到关闭浏览器的这一过程.session是会话过程中,服务器用来记录特定用户会话的信息. 比如今天双11,你淘宝网浏览了哪 ...

  6. python爬虫实例,一小时上手爬取淘宝评论(附代码)

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 1 明确目的 通过访问天猫的网站,先搜索对应的商品,然后爬取它的评论数据. ...

  7. python爬虫入门实战---------一周天气预报爬取_Python爬虫入门实战--------一周天气预报爬取【转载】【没有分析...

    Python爬虫入门实战--------一周天气预报爬取[转载][没有分析 Python爬虫入门实战--------一周天气预报爬取[转载][没有分析] 来源:https://blog.csdn.ne ...

  8. python爬虫多久能学会-不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据...

    原标题:不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据 Python爬虫为什么受欢迎 如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方 ...

  9. Python爬虫《自动化学报》数据爬取与数据分析

    Python爬虫<自动化学报>数据爬取与数据分析 文章目录 Python爬虫<自动化学报>数据爬取与数据分析 前言 一.代码 二.结果展示 三.爬虫实现 1.准备 2.获取网页 ...

最新文章

  1. .NET泛型解析(下)
  2. “ static”关键字在课程中做什么?
  3. Ubuntu下安装谷歌浏览器(Google chrome)报错
  4. Java进阶书籍推荐,赶快收藏起来!
  5. linux 修改ldap密码,Linux-ldap密码修改程序,如何加密ssha
  6. 面试经历-19-03-14
  7. php ab压力测试,安装Xcache缓存加速php及ab压力测试结果
  8. 基于React的PC网站前端架构分析
  9. Bind服务简单应用之一(介绍)
  10. IE 不支持单引号(')的实体名称(amp;apos;)
  11. DRF + react 实现TodoList
  12. Centos7虚拟机的镜像下载及创建
  13. 大学英语精读第三版(第四册)复习笔记——文章内容摘要
  14. 2021年互联网热梗盘点
  15. 学习 PixiJS — 动画精灵
  16. Docker部署若伊前后端分离项目到阿里云服务器
  17. 使用GBase企业管理器执行 select count(1) into @c from t1;报错解决方案
  18. Linux系统中UID和GID详解
  19. 七大设计原则(一):开闭原则
  20. 前端小白如何学习 CSS

热门文章

  1. 计算机丢失CH375DLL怎么办,修复ch375dll.dll
  2. 《近匠》Worktile王涛:典型MEAN架构下的团队协作工具
  3. 非零基础自学Golang 第1章 走进Go 1.2 Go语言官方文档 1.3 学好Go 的建议
  4. 《中华红》一个会作词的程序员
  5. 昆仑会员此打印方式只针对用会员卡结账的消费,放开限制解决方案
  6. R语言和医学统计学(2):方差分析
  7. Python实现植物大战僵尸
  8. 自动驾驶车辆控制(坐标转换与横向积分误差)
  9. 一文看懂-ElasticSearch全文搜索引擎
  10. python android自动化_2019最新某《安卓自动化测试入门》 Python篇