前言

当我们想快速了解 书籍、小说、电影剧本中的内容是时,则可以采用绘制 WordCloud 词云图,显示主要的关键词,可以非常直观的看到结果

核心代码

from wordcloud import WordCloud

import matplotlib.pyplot as plt

import jieba

from PIL import Image

import numpy as np

# 生成词云函数

def create_word_cloud(words):

# 使用结巴分词

text = " ".join(jieba.cut(words,cut_all=False, HMM=True))

wc = WordCloud(

font_path="./wc.ttf",

max_words=100,

width=2000,

height=1200,

)

wordcloud = wc.generate(text)

# 写词云图片

wordcloud.to_file("wordcloud.jpg")

# 显示词云文件

plt.imshow(wordcloud)

plt.axis("off")

plt.show()

测试

ok,现在我们来传入一段文字,生成词云图片分析一下

s= """

1.life lies in movement. 生命在于运动

2.sport is the source of all life. 运动是生命的源泉.

3.to keep on, day after day practice go down, and only activities to keep the enthusiasm of adequate training and improve motor skills.

日复一日地坚持练下去吧,只有活动适量才能保持训练的热情和提高运动的技能.——塞涅卡

4.activity is the basis of life! 活动是生活的基础!——歌德

5.people's sound, not only by foods, especially to rely on motion.人的健全,不但靠饮食,尤靠运动.

6.the olympic motto is "higher, faster, stronger." 奥林匹克的格言是“更高,更快,更强”.

7.the health of the body for motionless and destruction, for sports practice and keep for a long time. --socrates 身体的健康因静止不动而破坏,因运动练习而长期保持.——苏格拉底

chenqionghe

chenqionghe

chenqionghe

chenqionghe

chenqionghe

muscle

muscle

muscle

muscle

muscle

yeah buddy! Light weight baby

yeah buddy! Light weight baby

yeah buddy! Light weight baby

chenqionghe, go to the gym,yeah buddy! Light weight baby

I was in the gym lifting weights.

"""

create_word_cloud(s)

运行结果如下

分析这张图片,不验难看出,这段文字表达了:chenqionghe喜欢去运动,和light weight baby这几个词关系密切

原文:https://www.cnblogs.com/chenqionghe/p/12312934.html

python中wordcloud生成词云_python使用WordCloud生成词云相关推荐

  1. [转载] python中for语句用法_详解Python中for循环的使用_python

    参考链接: 在Python中将else条件语句与for循环一起使用 这篇文章主要介绍了Python中for循环的使用,来自于IBM官方网站技术文档,需要的朋友可以参考下 for 循环 本系列前面 &q ...

  2. 在python中random是什么意思_python中random是什么意思

    Python中的random是一个标准库用于生成随机数.随机整数.还有随机从数据集取数据. 一个简单的案例print( random.randint(1,10) )        # 产生 1 到 1 ...

  3. python中for语句用法_详解Python中for循环的使用_python

    这篇文章主要介绍了Python中for循环的使用,来自于IBM官方网站技术文档,需要的朋友可以参考下 for 循环 本系列前面 "探索 Python,第 5 部分:用 Python 编程&q ...

  4. python中异或怎么算_python 异或运算的前提_异或运算公式

    Python基础(10)–数字-Python-第七城市 609x288 - 73KB - JPEG Python基础(10)--数字_资讯_突袭网 609x288 - 33KB - JPEG pyth ...

  5. python爬取数据生成词云_Python 爬取生成中文词云以爬取知乎用户属性为例

    代码如下: # -*- coding:utf-8 -*- import requests import pandas as pd import time import matplotlib.pyplo ...

  6. python 引入同一路径的类_Python实现Wordcloud生成词云图的示例

    wordcloud是Python扩展库中一种将词语用图片表达出来的一种形式,通过词云生成的图片,我们可以更加直观的看出某篇文章的故事梗概. 首先贴出一张词云图(以哈利波特小说为例): 在生成词云图之前 ...

  7. python 小说 云_Python给小说做词云

    闲暇时间喜欢看小说,就想着给小说做词云,展示小说的主要内容.开发语言是Python,主要用到的库有wordcloud.jieba.scipy.代码很简单,首先用jieba.cut()函数做分词,生成以 ...

  8. python中map函数运行原理_Python中map函数的解释和可视化

    先重温一下迭代(Iteration).迭代器对象(iterable).迭代器(iterator )的概念: Iteration是计算机科学的通用术语,它是指对一组元素执行一项操作,一次执行一个元素.一 ...

  9. python中正则表达式的简单应用_Python正则表达式详细应用

    原文地址:http://www.jb51.net/article/65286.htm 1.了解正则表达式 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合, ...

  10. python中赋值不正确的_python中的“赋值与深浅拷贝”

    Python中,赋值与拷贝(深/浅拷贝)之间是有差异的,这主要源于数据在内存中的存放问题,本文将对此加以探讨. 1 赋值(添加名字) 赋值不会改变内存中数据存放状态,比如在内存中存在一个名为data的 ...

最新文章

  1. 2021-05-09为什么pip install安装的包anaconda识别不了
  2. FD.io/VPP — ACL
  3. Scala模式匹配:变量声明中的模式匹配
  4. spring注解方式 idea报could not autowire
  5. Tidb集群加mysql_TiDB - 快速入门,集群搭建
  6. 一步一步学Silverlight 2系列(33):Silverlight 2应用Web Service两例
  7. no suitable driver found for jdbc:mysql//localhost:3306/..
  8. 【linux就该这么学】-09
  9. 使用分层的方法设计 机器人软件
  10. oracle18c静默安装教程,CentOS7无图形化界面静默安装oracle18c
  11. zblog php 首页经常被篡改,浏览器首页经常被篡改,这样设置,自己也改不掉!...
  12. 南京计算机徐宪忠,nakaga
  13. gmail 邮件客户端设置
  14. 小米商城——HTML,CSS(附:源码)
  15. 汽车车灯注塑件三维尺寸公差检测
  16. 数学建模学习(27):对策论模型,代码+案例,讲很详细,别开小差,很烧脑!
  17. 刷子 撸一撸手头的几把刷
  18. Lenovo windows 解决win键失灵
  19. HNUCM 道具的魅力值(贪心算法)
  20. html和js基础功能代码备份

热门文章

  1. python量化交易的框架_python量化交易框架easyquant试用体会
  2. 覆盖5亿手机用户 乐播投屏有怎样的域名表现?
  3. 软件评测第五期:猎豹安全浏览器
  4. trim函数 php,[PHP源码阅读]trim、rtrim、ltrim函数
  5. 洛谷P1196 银河英雄传说
  6. Java全局变量怎么定义?什么是全局变量?
  7. MySQL数据库题目:查询一班得分在80分以上【杭州多测师】【杭州多测师_王sir】...
  8. 在抖音如何引流给自己的产品?抖音上火热的产品都特点是什么?
  9. html文字旋转以后变形,关于css:CSS3中的变形处理transform功能旋转缩放倾斜移动
  10. 全球与中国内拉床市场深度研究分析报告