目录

一、jieba库安装

二、wordcloud库安装

三、Hamlet词云生成程序代码

四、生成hamletwordcloud.png词云图

4.1 shaanxi.png背景图

4.2 hamlet.txt文件

五、带排除的三国演义中文分词

六、三国演义.txt文件

七、运行结果


一、jieba库安装

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba

二、wordcloud库安装

wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本。

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple wordcloud

三、Hamlet词云生成程序代码

# -*- coding: utf-8 -*-
"""
Created on Mon Jul 18 21:06:34 2022@author: zcq
"""import jieba
import wordcloud
from PIL import Image
import numpy as npf = open("hamlet.txt", "r", encoding="utf-8")t = f.read()
f.close()
ls = jieba.lcut(t)txt = " ".join(ls)mask = np.array(Image.open("shaanxi.png"))w = wordcloud.WordCloud( mask=mask, \width = 1000, height = 700,\background_color = "white",font_path = "msyh.ttc"    )
w.generate(txt)
w.to_file("hamletwordcloud.png")

四、生成hamletwordcloud.png词云图

4.1 shaanxi.png背景图

4.2 hamlet.txt文件

五、带排除的三国演义中文分词

import jieba
f = open("三国演义.txt","r",encoding='utf-8')
ls = jieba.lcut(f.read())
#ls = f.read().split()
f.close()excludes={"将军","却说","二人","不可","荆州","不能","如此"}
counts={}
for word in ls:if len(word)==1:continueelif word=="诸葛亮" or word =="孔明曰":rword="孔明"elif word=="关公" or word =="云长":rword="关羽"elif word=="玄德" or word =="玄德曰":rword="刘备"elif word=="孟德" or word =="丞相":rword="曹操"else:rword =wordcounts[rword]=counts.get(rword,0)+1
for word in excludes:del(counts[word])
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse =True)
for i in range(20):word,count=items[i]print ("{0:<10}{1:>5}".format(word,count))

六、三国演义.txt文件

七、运行结果

runfile('E:/Oliver学Python/program/threeking.py', wdir='E:/Oliver学Python/program')
曹操         1385
孔明         1342
刘备         1236
关羽          759
张飞          343
商议          335
如何          326
主公          318
军士          300
吕布          296
军马          284
左右          283
引兵          273
次日          262
大喜          259
孙权          256
天下          252
赵云          252
东吴          244
于是          242

资源下载链接:https://pan.baidu.com/s/1bbIk8ElMtfF10-TTT4B8rg 
提取码:ttxs

Python 分词与词云图生成相关推荐

  1. 小白都能学会的Python基础 第六讲:综合实战2 - 大数据分词与词云图绘制

    1.华小智系列 - Python基础(案例版) <Python基础>目录 第六讲:综合实战2 - 大数据分词与词云图绘制 1.大数据分词技巧 2.词频统计技巧 3.词云图绘制 4.微博词云 ...

  2. Python基于WordCloud词云图的数据可视化分析 词云图的基本使用 政府工作报告分析

    Python基于WordCloud词云图的数据可视化分析 词云图的基本使用 政府工作报告分析 文章目录 1.词云图简介 2.wordcloud库的安装 3.WordCloud的主要参数说明 4.绘制词 ...

  3. Python文本挖掘:词云图

    一.什么叫词云图? 词云图又叫文字云,是对文本数据中出现频率较高的关键词予以视觉上的突出,形成"关键词的渲染"就类似云一样的彩色图片,从而过滤掉大量的文本信息,,使人一眼就可以领略 ...

  4. 数据科学 | Python酷炫词云图原来可以这么玩

    ↑↑↑↑↑点击上方蓝色字关注我们! 『运筹OR帷幄』转载 作者:费弗里 编者按 词云图是文本挖掘中用来表征词频的数据可视化图像,通过它可以很直观地展现文本数据中的高频词.词云图过滤掉大量的低频低质的文 ...

  5. DayDayUp:寒门女孩考入北大→换角度看待表达《感谢贫穷》—关于吃苦与穷~~~Python之wordcloud词云图可视化

    DayDayUp:寒门女孩考入北大→换角度看待表达<感谢贫穷>-关于吃苦与穷~~~Python之wordcloud词云图可视化 目录 博主看法-关于吃苦与穷 文本内容 寒门女孩考入北大-& ...

  6. python image stiching_Python自然语言处理,词云图生成

    自然语言处理 本节介绍如何使用Python中的库,生成词云图,涉及自然语言处理的相关问题,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向.它研究能实现人与计算机之间用自然语言进行有效通信的 ...

  7. 利用python绘制简易词云图(使用jieba进行中文分词)

    词云(wordcloud)图能过滤掉大量的文本信息,使我们能抓住问题的集中点(一般集中点就是经常提到的点,也就是词频数会比较高).其实制作词云没什么技术含量,主要就是将用于绘制词云的所有词都传给软件, ...

  8. python中文词云图代码_Python文本处理NLP:分词与词云图

    ​昨晚我们又做了一次技术分享,继续上次技术分享的话题"文本数据的处理".上次,我们分享了文本处理的方方面面的知识点,比较宏观,这次我们就其中的一点"分词"展开. ...

  9. [Python]*词云图生成——默认和图片蒙版词云图

    1.生成默认画布词云图 : import wordcloud as wc #导入词云库 import jieba #jieba中文分词库 import matplotlib.pyplot as plt ...

  10. python画二维温度云图_利用python画出词云图

    本文将介绍如何利用python中相应的模块画出词云图.首先给出效果图: 其中词云图中的词汇是对手机短信中的垃圾短信的统计,字体越大表示在垃圾短信中出现的频次越高.下面给出具体的步骤. 读取" ...

最新文章

  1. android init.rc语法标准 .
  2. 怎样学java软件编程6_月光软件站 - 编程文档 - Java - 我学习使用java的一点体会(6)...
  3. k8s kubebuilder系列开发 — 理解和剖析 Kubebuilder
  4. 链表中环的入口结点 python_【Github 5K星】BAT头条滴滴小米等笔试面经+深度学习/算法/NLP资源汇总!...
  5. 图论之二分图-HihoCoder1121
  6. 数据结构题及c语言版4.31答案,数据结构参考题及答案修正版.doc
  7. 使用C++编程语言保存数据库查询结果的方法
  8. WebApp用组件方式开发全站
  9. Delphi Invalidate的用法
  10. CSR8615蓝牙芯片功能调试入门笔记---上
  11. 手机html怎么做苹果兼容性,兼容苹果手机的前端设置
  12. 顶级区块链开发人员工具:涉及框架、IDE、安全工具、测试网络、区块链预言机和节点服务
  13. 【定时任务】SpringBoot多线程并发动态执行定时任务
  14. 9个动作让网站3天被百度收录!
  15. 腾讯 AI Lab招聘算法实习生
  16. Axure知识点:如何制作输入关键词模糊搜索功能?
  17. MIMO信道容量仿真MATLAB,mimo系统的信道容量分析及matlab仿真.doc
  18. JS获取浏览器类型和版本信息
  19. 十七点学完安全知识超级详细了解进程和病毒知识 转载
  20. java压缩文件耗时:30秒到1秒的优化过程

热门文章

  1. PHP 中文手册-国内镜像
  2. android gps 获取方位_Android GPS定位 获取经纬度
  3. UrlRewrite 的配置和使用总结
  4. 推荐几款好用的编程字体
  5. 上古卷轴5json文件修改_捏脸工具-RaceMenu
  6. 图论复习(二)-——哈密顿图及其应用
  7. 戴尔显示rpc服务器,swmm(暴雨管理模型)安装完成后运行显示 RPC服务器不可用
  8. 微信小程序-实现保存图片功能的3种方式
  9. Java开源 J2EE框架(一)
  10. Idea利用JSP模板设置统一路径(basePath)