目录

7影评词云分析

下载

​编辑 停用词处理:

从PIL中导入Image的图片

词云运行结果图:


喝瓶旺仔咱们继续 ......


7影评词云分析

下载

pip install jieba  (如果一次下载没成功,就多下几次,不行了就上网查)

pip install jieba

collections 统计词量

import jieba
import wordcloud
import collections

lcurt以列表形式对字符串进行切割

jieba.lcut(df['评论'][0])

运行结果图如下:

我这边是有一个停用词文件(stopwords.txt),大家也可以在网上查找一下资源。

将停用词放在stop_words中,并且将停用词中的\n切掉。

代码展示如下:

with open('stopwords.txt','r',encoding='utf-8')as fp:words=fp.readlines()stop_words = []
for word in words:w = word.strip('\n')#将单词中的反斜杠n切掉stop_words.append(w)
stop_words

运行结果图:


 停用词处理:

接下来我们开始对停用词进行处理,word_list = jieba.lcut(comment)。

然后对word_list做遍历,去掉停用词(可去网上找停用词资源)

#停用词处理
good_words =[]for comment in df['评论']:word_list = jieba.lcut(comment)#对word_list做遍历,去掉停用词(去网上找停用词资源)for word in word_list:if word not in stop_words:good_words.append(word)

在下面这个代码中我们进行字体类型(蒙纳超刚黑简.ttf)的应用,并向词云对象配置词数数据,最终展示图片。代码如下:

c = collections.Counter(good_words)wc = wordcloud.WordCloud(font_path='蒙纳超刚黑简.ttf',width=500,height=300,background_color='white',max_font_size=200,min_font_size=5,max_words=1000)
#向词云对象配置词数数据
wc.generate_from_frequencies(c)#展示图像
plt.imshow(wc)

运行结果如下:这个时候的词云大小颜色啥的都是由系统默认给出 ,如图所示:

 从PIL中导入Image的图片

from PIL import Image

在上一个词云代码的基础上,我们给它添加了一个爱心的背景图片,并且给词云定义一种颜色由深到浅的,然后顺便将图旁边的横纵坐标关掉。代码如下:

back_image = Image.open(r'C:\Users\1\Desktop\1.png')c = collections.Counter(good_words)#调画布
plt.figure(figsize=(12,7))wc = wordcloud.WordCloud(font_path='蒙纳超刚黑简.ttf',width=500,height=300,background_color='white',#背景颜色为白色max_font_size=200,min_font_size=5,#调节词的大小为5-200max_words=1000,#最多能容纳词的数量为1000mask=np.array(back_image),   #放图片colormap=sns.dark_palette('pink',as_cmap=True)  #调词云颜色为一种颜色由深到浅的紫色,记得设置as_cmap=True这个参数,否则代码无法识别这个作为颜色参数处理)
#向词云对象配置词数数据
wc.generate_from_frequencies(c)#展示图像
plt.imshow(wc)
#把图旁边的横纵轴关掉
plt.axis('off')

词云运行结果图:


至此数据可视化-《白蛇2:青蛇劫起》就此分析结束。觉得有用的友友们给我小小的点个赞吧,比心。

数据可视化-《白蛇2:青蛇劫起》(3)相关推荐

  1. 昱家良品《白蛇2青蛇劫起》官方正版衍生品众筹破四百九十万元!

    7月23日,暑期档国漫<白蛇缘起2:青蛇劫起>正式上映,目前票房已突破3亿元,蝉联7天票房冠军,可见粉丝对电影的热捧.更值得一提的是,电影上映当日,由昱家良品和花果山合作推出的<白蛇 ...

  2. Pyecharts | 《白蛇2:青蛇劫起》20000+数据分析可视化

    文章目录

  3. 数据可视化-《白蛇2:青蛇劫起》(1)

    目录 数据加载与预处理 前提:工具包引入 数据查看 过滤空值 重置 可视化分析 1.评分等级分布 2.每日评论量 3.每小时评论量 数据加载与预处理 前提:工具包引入 #数据处理 import num ...

  4. 数据可视化-《白蛇2:青蛇劫起》(2)

    目录 可视化分析 4.一周各天评论量 5.主要角色热度分析 6.可视化地图边界 这边这个前提工作我们在数据可视化-<白蛇2:青蛇劫起>(1)中已经运行过了,在这边再次放一下,方便观看使用, ...

  5. # 个人日记-电影《白蛇2:青蛇劫起》电影观后感-20210724

    个人日记-电影<白蛇2:青蛇劫起>电影观后感-20210724 本周看了电影<白蛇2:青蛇劫起>,整体非常推荐,叙事紧凑,思维发散. 整部电影讲了女主青蛇为了救出白蛇,执念太深 ...

  6. 大国之殇,唐山大地震44周年 | 地质灾害数据可视化

    ""一座城市的劫难与重生,包含着无尽悲欢,也见证着无数奋起.从曾被西方媒体预言"将从地球上被抹掉"的满目疮痍,到今天奋翅于冀东沃野的现代化城市,唐山40年的沧桑 ...

  7. 【置顶】利用 NLP 技术做简单数据可视化分析教程(实战)

    置顶 本人决定将过去一段时间在公司以及日常生活中关于自然语言处理的相关技术积累,将在gitbook做一个简单分享,内容应该会很丰富,希望对你有所帮助,欢迎大家支持. 内容介绍如下 你是否曾经在租房时因 ...

  8. 只要5分钟用数据可视化带你看遍11月份新闻热点事件

    2017年11月份已经离我们而去,在过去的11月份我们也许经历了双十一的剁手,也可能亲眼看见了别人剁手.11月份的北京大兴区发生了"11·18"重大火灾,国内多家幼儿园也多次上了头 ...

  9. 机器学习PAL数据可视化

    机器学习PAL数据可视化 本文以统计全表信息为例,介绍如何进行数据可视化. 前提条件 完成数据预处理,详情请参见数据预处理. 操作步骤 登录PAI控制台. 在左侧导航栏,选择模型开发和训练 > ...

最新文章

  1. 覆盖所有类型的javascript深度克隆
  2. ReactiveCocoa中潜在的内存泄漏及解决方案
  3. Pytorch 中 matmul 广播
  4. MySQL索引优化分析
  5. 【Python】Python库之数据分析
  6. javascript中 __proto__与prorotype的理解
  7. 模拟监控和真实用户体验监测,选哪个?
  8. VisualStudio quick tips -- 快速在多个打开的代码文件间切换
  9. python做数据分析对数学要求_Python数据分析之Pandas
  10. FPGA入门——初学建议
  11. I2C接口触摸屏驱动分析
  12. 超简洁好看的个人网站导航页源码
  13. 计算机扩容硬盘,扩容盘是什么 如何恢复真实容量【方法详解】
  14. ei会议和ei源刊的区别_Ei期刊和ei会议论文有哪些区别
  15. word文件转换成PDF文件
  16. 带宽叠加是什么意思?
  17. 5分钟学会Pixel刷机
  18. 中学物理奥林匹克竞赛竞赛大纲
  19. ppp服务器连通状态 失败移动,某局点MSR路由器PPPOE拨号IPCP阶段协商失败处理案例...
  20. CSDN博客,Fer来也!

热门文章

  1. 天祥电子avr视频中的AVR_PQ1A.h头文件
  2. 软件测试webtours飞机票bug档案,LoadRunner使用MercuryWebTours订机票的问题
  3. 手机浏览器下载哪个好用
  4. 银联app控件 php后台开发
  5. 重新连接HRC+ SmartFoxServer 2X
  6. python的选择结构教学设计_python选择结构教学设计
  7. js实现手机号码与登录密码,身份证验证
  8. 微信PC最新测试版3.3.0.60 朋友圈采集 HOOK技术
  9. 代付系统(包含手机端自动支付功能)
  10. 飞桨PaddlePaddle深度学习七日打卡营结营体会(小白菜只想混算力康康证书)