继上一篇爬取《我不是药神》的评论后,现在开始使用jieba分词和词云来分析评论。

下面是代码:

import matplotlib.pyplot as plt
from wordcloud import WordCloud
from scipy.misc import imread
import jiebatext = open(r"yaoshen.txt","rb").read()
wordlist = jieba.cut(text)
wl = ' '.join(wordlist)      #将分词后的文本存入到一个列表中#设置停用词
stopwords_list = []
with open('stopwords.txt', 'r') as f:for line in f.readlines():stopwords_list.append(line.strip())                                             #停用词设置
wc = WordCloud(background_color = "white", #设置背景颜色mask = imread('shen.png'),  #设置背景图片max_words = 2000, #设置最大显示的字数stopwords = stopwords_list,    #["的", "这种", "这样", "还是", "就是", "这个", "没有","但是", "可以","真的","我们","导演", "看到","一个",'可能','一部'], #设置停用词font_path = r"C:\Windows\Fonts\simkai.ttf",  # 设置为楷体 常规#设置中文字体,使得词云可以显示(词云默认字体是“DroidSansMono.ttf字体库”,不支持中文)max_font_size = 60,  #设置字体最大值random_state = 30, #设置有多少种随机生成状态,即有多少种配色方案)myword = wc.generate(wl)#生成词云
wc.to_file('result.jpg')#展示词云图
plt.imshow(myword)
plt.axis("off")
plt.show()

运行后可以得到的词云:

《我不是药神》评论词云分析相关推荐

  1. MongoDB 实战(一)基于PyMongo的电影影评分析 | 对数据结果进行可视化展示以及分析 | 评论词云 | 分时间段分析

    文章目录 一.运行环境 二.实战介绍 三.获取数据 四.PyMongo 实战 4.1 连接MongoDB.创建集合 4.2 向 MongoDB 插入文档 4.3 查询MongoDB的数据 4.4 同样 ...

  2. 词云分析——基于Python对天猫商品评论进行词云分析

    文章目录 0 引言 1 准备工作 2 主程序 3 分析与改进 4 可能出现的报错及解决方案 0 引言 什么是词云分析? 词云图,也叫文字云,是对文本中出现频率较高的"关键词"予以视 ...

  3. Python文本分析实战:《跨越星弧》TapTap玩家评论内容词云分析

    许久之前写了一篇<Python网络爬虫实战>的博客,里面讲了爬虫的过程,但是没有讲如何分析.这次讲述一下用如何通过词云分析,来从这些文本数据里面获得结论 首先,回顾一下分析背景 主要是看了 ...

  4. 【小盐巴学习笔记】—美团吃饭哪家强?Python词云分析告诉你

    [小盐巴学习笔记]-美团吃饭哪家强?Python词云分析告诉你 效果图 前言 一.爬虫分析 1.分析网址 2.分析数据 二.完整代码 1.爬取美团牛排店评论 2.绘制词云图 3.词云分析 总结 效果图 ...

  5. python爬虫:词云分析最热门电影《后来的我们》

    跟闺蜜周末去看了电影<后来的我们>,被感动的一塌糊涂,回来后心血来潮,写了这么个词云分析工具~ 1 模块库使用说明 1.1 requests库 requests 是用Python语言编写, ...

  6. 大江大河2弹幕数据之词云分析、情感极性分析、主题分析、共现网络分析

    最近,自己在疯狂追<大江大河2>这部剧,作为当下最热门的电视剧之一,这部电视剧深受观众的喜爱,自从播出以后就好评不断 它主要讲述了改革开放三十年,一代人奋斗向阳的故事,看完之后深受启发,特 ...

  7. jieba库词频统计_如何用python对《三国演义》、《红楼梦》等名著开展词云分析及字频统计、出场统计等工作。...

    以下以<红楼梦>为例进行设计. 在制作词云图及统计之前,需要下载python的几个库,wordcloud.jieba以及imageio等,我的操作系统为Windows10,IDE环境为id ...

  8. python词云代码手机_【云计算】爬取淘宝手机品牌词云分析(python)

    本文主要向大家介绍了[云计算]爬取淘宝手机品牌词云分析(python),通过具体的内容向大家展现,希望对大家学习云计算有所帮助. 淘宝手机信息的爬取,请看这边博客(点击这里),然后我们利用其中保存的文 ...

  9. NO.16——Pathon爬取杨超越新浪微博数据做词云分析

    看到网上充斥着很多词云分析的资料,今天心血来潮,也尝试下词云分析.最近热火的<创造101>,杨超越小姐姐一直在风口浪尖,因此这里借用小姐姐的微博数据做分析. 一.准备工具 作词云分析主要用 ...

最新文章

  1. 计算机组成原理2套题,计算机组成原理试卷及答案2套.doc
  2. 原码、补码、反码、1的补码
  3. linux cat EOF使用示例
  4. HAN:基于双层注意力机制的异质图深度神经网络
  5. C# 判断给定大数是否为质数,目标以快速度得到正确的计算结果。
  6. 在Docker里面安装Ubuntu,并且使用ssh进行连接
  7. mx250是什么_来看看联想小新Pro13 2020款和2019款哪个好?区别是什么?
  8. SQL2005数据库连接
  9. AHT20温湿度传感器STM32-I2C驱动,替代DHT11/DHT12/AM2320/SHT20/SHT30,IIC代码兼容AHT10/15-MEMS温湿度传感器
  10. 计算机vfp程序设计题,2012年计算机级VFP程序设计基础习题及答案.doc
  11. 第15章-使用远程服务
  12. ibm服务器网络安装系统安装系统安装教程,IBM服务器系统安装步骤.doc
  13. IDEA 格式化代码快捷键冲突解决
  14. SPSS 探索性因素分析与验证性因素分析的区别【SPSS 034期】
  15. MySQL查询指令示例---初学者必看
  16. MySql表的基本增删改查详解
  17. “去中心化”和“分布式”的区别
  18. The software-quanlity landscape -- Code complete reading notes
  19. 阿里内部Redis宝典遭外泄极致经典:源码+实战+理论
  20. 输入一个大于3的整数n,判定它是否为素数。例题5.9

热门文章

  1. PCM 音频格式分析
  2. MybatisPlus+mbg(代码生成器)
  3. CUDA安装位置版本查询
  4. SQL Server 数据库之聚合函数
  5. 2022年无线蓝牙耳机推荐?口碑最好的国产无线蓝牙耳机推荐
  6. 【TDH】Search 安装问题
  7. qq在线模板html,浮动在网页右侧的简洁QQ在线客服
  8. 基于CNN的手写体识别与GUI系统设计(新手快进来!)
  9. 【方案篇】事件监听函数的内存泄漏,帮你搞定!不谢!!!
  10. [推荐算法]UserCF,基于用户的协同过滤算法