首先说明wordcloud库,词云库

import wordcloud#首先创建词云对象,给参数
w = wordcloud.WordCloud()

参数还是挺多的,主要用到的:如果有中文,一定要设置字体路径,否则出来都是框框,宽高随意,mask可以指定生成的形状,需要载入图片,背景白色,稍后提到,max_words可以设置单词最大个数,默认200,后面是最小字体,最大字体,以及之间的步长,色彩模式默认为RGB,常用的还有背景颜色设置

import wordcloudw = wordcloud.WordCloud(width=1000,height=500,background_color='white')w.generate('life is short you need python')
w.to_file('2.png')

设置背景形状在势力中说明


重点来了 ,利用词频统计的一些代码,并加入形状文件,使用一张背景为白色的中国地图

import jieba
import wordcloud
from scipy.misc import imread
img = imread('china1.jpeg')includes = ['将军','却说','二人','不可','荆州','如此','不能','商议','如何','主公','军士','左右','军马','引兵','次日','大喜','天下','于是','东吴','今日','不敢','魏兵','人马','不知','汉中','陛下','一人','众将','只见','蜀兵','大叫','上马','此人','后人','城中']
def get_text():f = open('三国演义.txt','r',encoding='utf-8').read()words = jieba.lcut(f)ls = []for i in words:if len(i)==1 or i in includes:continueelif i in ['丞相']:ls.append('曹操')elif i in ['孔明曰','孔明']:ls.append('诸葛亮')elif i in ['玄德曰', '玄德']:ls.append('刘备')elif i in ['关公', '云长']:ls.append('关羽')elif i in ['都督']:ls.append('周瑜')else:ls.append(i)return ' '.join(ls)txt = get_text()
w = wordcloud.WordCloud(font_path='msyh.ttf',width=1000,height=500,background_color='white',mask=img)w.generate(txt)
w.to_file('1.jpg')

加载形状图片要用到scipy库的imread方法

结果还是挺炫的

Python-继人物词频统计三国演义之后-三国词云(Wordcloud)相关推荐

  1. 词频统计以及分析(词云制作)

    对文章进行词频的统计,分析文章的所属类型,分析文章是否满足要求,进行等等操作的时候,就需要进行词频的统计,还有就是制作一个词云图,直观显示文章的比重. 一.对英语文章的分析. 首先对文章进行特征处理( ...

  2. 三国演义人物词频统计-4

    题目来源:Python语言程序设计 授课老师: 嵩天.黄天羽.礼欣 hamlet小说下载路径:https://python123.io/resources/pye/threekingdoms.txt ...

  3. 三国演义人物词频统计-1

    题目来源:Python语言程序设计 授课老师: 嵩天.黄天羽.礼欣 hamlet小说下载路径:https://python123.io/resources/pye/threekingdoms.txt ...

  4. 三国演义人物词频统计-3

    题目来源:Python语言程序设计 授课老师: 嵩天.黄天羽.礼欣 hamlet小说下载路径:https://python123.io/resources/pye/threekingdoms.txt ...

  5. 三国演义人物词频统计-2

    题目来源:Python语言程序设计 授课老师: 嵩天.黄天羽.礼欣 hamlet小说下载路径:https://python123.io/resources/pye/threekingdoms.txt ...

  6. python红楼梦人物词频统计_用Python绘制红楼梦词云图,竟然发现了这个!

    原标题:用Python绘制红楼梦词云图,竟然发现了这个! Python在数据分析中越来越受欢迎,已经达到了统计学家对R的喜爱程度,Python的拥护者们当然不会落后于R,开发了一个个好玩的数据分析工具 ...

  7. python红楼梦词频统计

    python红楼梦词频统计 <红楼梦>人物的出场统计涉及对词汇的统计,中文文章的需要分词才能进行词频统计,需要用到jieba库. 分析过程: 代码: import jieba txt=op ...

  8. 浅析如何用Python进行中英文词频统计

    浅析如何用Python进行中英文词频统计 主要思路: 读取数据 数据预处理 分词 词频统计 结果显示 词频统计 TF-IDF(term frequency–inverse document frequ ...

  9. 《红楼梦》中人物词频统计

    <红楼梦>人物词频统计 import jieba import re f=open('红楼梦.txt',encoding='utf-8') txt=f.read() f.close()tx ...

  10. 用Python爬取B站弹幕并做成词云

    用Python爬取B站弹幕并做成词云 一.获取视频的cid号 1.进入想爬的视频,打开浏览器设置里的"开发者工具": 进入NetWork后等待requests刷出,数据够了后可随意 ...

最新文章

  1. 用异或来交换两个变量能提快速度是错误的
  2. Python-OpenCV 笔记6 -- 轮廓(Contours)
  3. STM32 之十 供电系统及内部参照电压(VREFINT)使用及改善ADC参考电压
  4. [vim]在vim中格式化xml
  5. 前端学习(2372):uni-ui库
  6. 开源的关系型数据持久化组件
  7. mysql 创建表check如何使用_MySQL怎么使用check约束
  8. linux安装pgsql源码包解压,在Linux(centos)中使用源码安装pgRouting
  9. JavaScript机器学习之KNN算法
  10. nagios监控linux主机,Nagios监控平台之二:nrpe监控远程Linux主机 | 旺旺知识库
  11. Futter基础第17篇: 实现多行文本框、开关按钮、多选框、单选按钮、RadioListTile、Radio、表单
  12. Javascript倒计时 支持自定义样式
  13. VsCode如何设置成中文
  14. 在使用RadASM一开始的过程中遇到的问题汇总(后续更新)
  15. 华为手机微信聊天记录删除怎么恢复?基于华为电脑助手备份的恢复方法
  16. JS实现数字自动转换人民币金额(自动格式化输入的数字/千位分隔符)
  17. 计算机专业排名2014,2014计算机考研院校排名
  18. 【计算机网络】HTTP协议中Get与Post的区别
  19. silverlight系列(Grid、Border、Sharp、Brush)
  20. python 栈实现 加减乘除_Python自学笔记,编程中简单的加减乘除

热门文章

  1. groovy脚本一键360加固多渠道打包
  2. 新益华基层医疗系统使用方法_家中更换新路由器了,但不知道如何替换?可以尝试使用这种方法...
  3. 【Excel实战】按指定字符拆分字符串
  4. iocp中GetQueuedCompletionStatus 121 信号灯超时时间已到 (error sem timeout)
  5. Oracle密码过期
  6. Oracle密码过期解决办法
  7. 劳动合同书电子版范本word下载【收藏备用】
  8. QGIS教程01:为什么要用QGIS?
  9. android思维导图软件推荐,免费好用还跨平台!这5款主流思维导图软件,每一个都让人怒赞...
  10. c语言酒店管理系统,基于C#的酒店管理系统(V3.1)最新版