数据链接:https://pan.baidu.com/s/1zzKSJJEhYr20aUtWSPgQWQ 
提取码:1234

#导入相关库并读取数据
%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
data  = pd.read_csv("D:/天池竞赛/用户情感分析/earphone_sentiment.csv",encoding="gbk")
data

#词云
from wordcloud import WordCloud
import jieba
from PIL import Image
#对列表中每条评论数据进行处理,去掉停用词和符号
from string import punctuation
add_punc=',。、【 】 “”:;()《》‘’{}?!⑦()、%^>℃:.”“^-——=&#@¥'
stop_words={'你','我','的','了','人','都','和','在','不','比','就','但','也','是','有','吧','很','还','啊','个','说','会','去','用','这','就是','但是','还是','还有','不是','现在','的话','觉得','不过','只是','因为','什么','如果','而且','森林','看看','没有','等','没','要','那','所以','自己','看过','这个','知道','一个','或者','后','吗','看'}
stop=add_punc+punctuation+str(stop_words)
list = data["content"].tolist()
ls = []
for i in list:words = jieba.lcut(i)for s in words:if s.strip() in stop:passelse:ls.append(s.strip())

#导入地图形状,构造词云
mask=np.array(Image.open("D:/天池竞赛/用户情感分析/map.jpg"))
wc =WordCloud(scale=6,font_path='simhei.ttf',     background_color='white',   max_font_size=500,           min_font_size=5,max_words=400,collocations=False,font_step=1,mask=mask
)
s=wc.generate(' '.join(ls))
fig,axes = plt.subplots(figsize=(18,18))
plt.axis('off')
plt.imshow(s)
wc.to_file('wc.jpg')

#柱状图
plt.figure(figsize=(20,8))
data['subject'].value_counts().plot.bar()

plt.figure(figsize=(20,8))
data['sentiment_word'].value_counts().plot.bar()

plt.figure(figsize=(10,8))
#将1,0,-1分别进行替换
data['sentiment_value'].replace(1,"好评",inplace=True)
data['sentiment_value'].replace(-1,"差评",inplace=True)
data['sentiment_value'].replace(0,"未填写或中评",inplace=True)
data['sentiment_value'].value_counts().plot.bar()

#相关性系数热力图
import seaborn as sns
one_hot_1 = pd.get_dummies(data["subject"])
plt.figure(figsize=(15,15))
sns.heatmap(one_hot_1.corr(),cmap='YlGnBu') 

one_hot_2 = pd.get_dummies(data["sentiment_word"])
plt.figure(figsize=(15,15))
sns.heatmap(one_hot_2.corr(),cmap='YlGnBu') 

one_hot_3 = pd.get_dummies(data['sentiment_value'])
plt.figure(figsize=(10,10))
data['sentiment_value'].replace(1,"好评",inplace=True)
data['sentiment_value'].replace(-1,"差评",inplace=True)
data['sentiment_value'].replace(0,"未填写或中评",inplace=True)
sns.heatmap(one_hot_3.corr(),cmap='YlGnBu') 

用户情感可视化分析——天池竞赛相关推荐

  1. 天池比赛——用户情感可视化分析

    天池比赛--用户情感可视化分析 目录 天池比赛--用户情感可视化分析 前言 一.读取数据,查看基本情况并做数据预处理 引入相关库 读取数据,基础分析数据 空值处理,数据映射 对评论进行分词分析 二.词 ...

  2. 天池:数据分析达人赛1:用户情感可视化分析

    [教学赛]数据分析达人赛1:用户情感可视化分析 赛题背景 赛题以网络舆情分析为背景,要求选手根据用户的评论来对品牌的议题进行数据分析与可视化.通过这道赛题来引导常用的数据可视化图表,以及数据分析方法, ...

  3. 【天池学习赛】数据分析达人赛1:用户情感可视化分析

    赛题简介 赛题以网络舆情分析为背景,要求选手根据用户的评论来对品牌的议题进行数据分析与可视化.通过这道赛题来引导常用的数据可视化图表,以及数据分析方法,对感兴趣的内容进行探索性数据分析. 赛题数据 数 ...

  4. 【数据分析】数据分析达人赛1:用户情感可视化分析

    目录 赛题背景 赛题数据 1.导入数据分组 2.文本清洗 3.绘制词云 4.情感分析 (SnowNLP计算情感得分) 5.绘制不同情感值的柱形图 6.不同主题下的情感得分柱形图 7.绘制不同情感词下的 ...

  5. Tableau和BDP,哪个才是最适合中国用户的可视化分析工具?

    本人数据分析师一枚,除了工作所需,自己对数据分析.数据可视化的产品工具都比较感兴趣,喜欢混迹于各种数据论坛,也发现和使用了不少数据工具,也积累了很多亲身经历.这两年数据可视化在国内越来越受到关注,今天 ...

  6. 毕设——电商产品评论数据的用户情感倾向分析

    1.主要研究内容包括:(1)在查阅国内外文献资料的基础上,了解电商产品评论数据情感分析关键技术流程及国内外研究现状:(2)采用网络爬虫工具(如八爪鱼采集器)采集评论数据,实现文本去重.压缩去词等文本评 ...

  7. 超市产品关联性分析——天池竞赛

    天池大赛产品关联性分析数据集:https://pan.baidu.com/s/1CFxIDu8enrCbj50JQlHiMg  提取码:1234 #首先进行数据预处理 import pandas as ...

  8. 基于Python股票网站数据爬虫情感可视化分析设计

    开发软件:Pycharm  开发环境: Python3.6 开发技术:Requests,Pandas,numpy,csv,Matplotlib,SnowNLP,seaborn (1)getData爬取 ...

  9. TableauBDP,哪个才是最适合中国用户的数据可视化分析工具?

    作者:pledge 本人数据分析师一枚,除了工作所需,自己对数据分析.数据可视化的产品工具都比较感兴趣,喜欢混迹于各种数据论坛,也发现和使用了不少数据工具,也积累了很多亲身经历.这两年数据可视化在国内 ...

最新文章

  1. spring-session使用教程(一):redis共享session
  2. java使用keystore认证过程(license认证)
  3. arcgis for android离线编辑,操作方法:直接从 Android 或 iOS 设备访问 Collector for ArcGIS 中的离线编辑内容...
  4. python编程8g的内存够么_详解解决Python memory error的问题(四种解决方案)
  5. 幂等和高并发在电商系统中的使用
  6. java 转储快照分析_分析Java核心转储
  7. 元类--用不上的先了解
  8. Session保存到Memcache
  9. linux vg划分目录,修改根目录所在VG名称
  10. 传爱立信两大股东欲弹劾CEO卫翰思 股价应声反弹
  11. Go语言的指针的一些测试
  12. python3 下载网络图片
  13. VB程序与win8/ win10系统不兼容问题汇总
  14. win10系统下xilinx烧写器不亮
  15. 不限空间大小 会赚钱的网盘 收益模式详解
  16. 用python处理excel文件_python处理Excel文件
  17. Anaconda3-5.2.0+PyTorch1.3.0+cuda9.2本地安装教程
  18. []==![]结果为true,探究 == 本质
  19. OLED通信方式_IIC通信
  20. 距阵乘以一个未知距阵得单位矩阵 怎么算_想要定制家具?板材会选吗,知道价格怎么计算比较合理吗?...

热门文章

  1. 智慧数字经营要怎么代理加盟? 本文详解。
  2. 机房监控系统解说—防火墙篇
  3. 欢迎中文社区新版主@黄念刚
  4. 《人月神话(The Mythical Man-Month)》2人和月可以互换吗?人月神话存在吗?
  5. Python 爬取迷你MP4电影网,电影名称保存到本地,Requests+lxml框架
  6. cnpm和npm使用,遇到的问题及解决方法
  7. 【附源码】计算机毕业设计SSM我的大学电子相册
  8. 微信语音转文字的体验报告
  9. 解决iPhone手机时间格式化“NAN“问题
  10. 全球及中国机器视觉光源行业市场调查及投资可行性研究报告2022-2028年