1. 读入数据,删除NAN,用jieba分词
df = pd.read_csv("./data/entertainment_news.csv", encoding='utf-8')
df
df = df.dropna()
df
content=df.content.values.tolist()
content
#jieba.load_userdict(u"data/user_dic.txt")
segment=[]
for line in content:try:segs=jieba.lcut(line)for seg in segs:if len(seg)>1 and seg!='\r\n':segment.append(seg)except:print linecontinue2. 去掉停用词
words_df=pd.DataFrame({'segment':segment})
#words_df.head()
stopwords=pd.read_csv("data/stopwords.txt",index_col=False,quoting=3,sep="\t",names=['stopword'], encoding='utf-8')#quoting=3全不引用
#stopwords.head()
words_df=words_df[~words_df.segment.isin(stopwords.stopword)]
words_df3. 统计计数words_stat=words_df.groupby(by=['segment'])['segment'].agg({"计数":numpy.size})words_stat=words_stat.reset_index().sort_values(by=["计数"],ascending=False)
words_stat.head()4. 绘图wordcloud=WordCloud(font_path="data/simhei.ttf",background_color="white",max_font_size=80)
word_frequence = {x[0]:x[1] for x in words_stat.head(1000).values}
wordcloud=wordcloud.fit_words(word_frequence)
plt.imshow(wordcloud)

wordcloud用来制作中文词云相关推荐

  1. 使用Python制作中文词云

    使用Python制作中文词云 0 素材 & 库 准备 0.1 文本和图片 0.2 库准备 步骤 1. 准备工作 2. 文本处理 2.1 读取文本 2.2 分词和过滤 2.3 统计词频: 3. ...

  2. python制作中文词云_Python如何生成词云(详解)

    前言 今天教大家用wrodcloud模块来生成词云,我读取了一篇小说并生成了词云,先看一下效果图: 效果图一: 效果图二: 根据效果图分析的还是比较准确的,小说中的主人公就是"程理" ...

  3. python3制作中文词云_Python_制作中文词云

    准备工作: 安装 jieba 中文分词工具 安装 wordcloud 词云生成工具 下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/ 在命令行执行: p ...

  4. Python_制作中文词云

    准备工作: 安装 jieba 中文分词工具 安装 wordcloud 词云生成工具 下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/ 在命令行执行: p ...

  5. Python中使用wordcloud生成漂亮的中文词云

    场景 实现 新建文件夹ChinaMapWordCloud 文件夹下新建fonts目录用于存放字体. 新建ChinaMap.py from wordcloud import WordCloud impo ...

  6. python词云需要导入什么包_[python] 词云:wordcloud包的安装、使用、原理(源码分析)、中文词云生成、代码重写...

    词云,又称文字云.标签云,是对文本数据中出现频率较高的"关键词"在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思.常见于博客. ...

  7. python生成中文词云的代码_[python] 基于词云的关键词提取:wordcloud的使用、源码分析、中文词云生成和代码重写...

    1. 词云简介 词云,又称文字云.标签云,是对文本数据中出现频率较高的"关键词"在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意 ...

  8. 用python实现中文词云完整流程(wordcloud、jieba)

    我们将用python3的第三方库wordcloud来做中文词云.通过对2月3日-2月5日国家卫健委的三天记者会实录做词云分析,一定程度上,我们可以得到三天内舆情动向及官方侧重点的变化. # 第三方库 ...

  9. python——wordcloud生成中文词云

    毕设中期答辩,想展示一下前期数据抓取和聚类的成果,感觉词云这种形式不错,于是简单学习了一下wordcloud. 首先是安装 我是使用pip直接安装的, pip install wordcloud 没有 ...

最新文章

  1. plc原理及应用_施耐德PLC应用技术
  2. python叫什么-什么叫Python运算符重载
  3. 论文笔记:Weighted Graph Cuts without Eigenvectors:A Multilevel Approach
  4. HFun.快速开发平台(一)=》简述
  5. 360怎么看电脑配置_电脑速度慢怎么办?教你电脑速度慢的原因与解决方法
  6. Spring Boot笔记-Hibernate中@ManyToOne及@OneToOne
  7. 游标sql server_SQL Server游标性能问题
  8. 2019最新蚂蚁金服Java 4面真题
  9. w3school和w3cschool两个网站有什么关系和区别?
  10. editplus java快捷键_常用editplus快捷键大全
  11. 批量群发邮件方式集锦,foxmail群发多少封邮件?
  12. php工具apache启动失败,phpstudy中apache启动失败的原因是什么?
  13. 试用蓝牙模块的一点经验整理(Part 3, 关于iBeacon功能 )
  14. 解决顺序表实现队列的假溢出的循环队列
  15. 【MySQL系列】数据结构详解(全网最全)
  16. cocos2dx layer理解
  17. 最牛逼 Java 日志框架 — Log4j2,性能无敌,横扫对手.....
  18. layui表头样式_layui表格的样式设置
  19. bert 中文 代码 谷歌_1美元从零开始训练Bert,手把手教你优雅地薅谷歌云TPU羊毛...
  20. 布考斯基样样干_没有酒,我就是个无趣的人——查尔斯·布考斯基

热门文章

  1. 39行代码AC_HDU-6740 2019CCPC秦皇岛 J MUV LUV EXTRA(KMP变形)
  2. 部署yum仓库与NFS服务
  3. 了解ACL(访问控制列表)一些简单的ACL小实验
  4. shell脚本详解(一)——Shell编程规范与变量
  5. windows7系统损坏修复_修复损坏的系统文件,就用系统文件检查器SFC,简单高效...
  6. Java自带的线程池ThreadPoolExecutor详细介绍说明和实例运用
  7. JLabel标签文字换行
  8. php双层foreach,php 双层foreach 如何提升效率
  9. 测试硬盘读写速度软件_Linux 测试 IO 性能(磁盘读写速度)
  10. java环境变量设置的作用_JDK环境变量的配置及作用