问题描述:

如何利用python画出一个多变的词云图?

解决方法:import numpy as np

import matplotlib

import matplotlib.pyplot as plt

from wordcloud import WordCloud

plt.figure(figsize = (12,8))

%matplotlib inline

plt.rcParams['axes.unicode_minus'] = False

test=['a','b','c','d','a','b']*10+['e','f','g','h','i','j','k']*3+['l','m','n','o','p','q','r','s','t']

words_df=pd.DataFrame({'words':test})

words_df.head()

words_stat=words_df.groupby(by=['words'])['words'].agg({'counts':np.size});

words_stat

words_stat = words_stat.reset_index().sort_values(by=['counts'], ascending=False)

words_stat

# 生成词云图,WordCloud默认不支持中文,需要自己下载好中文字库

wordcloud = WordCloud(font_path="simhei.ttf", background_color="white", max_font_size=80)

word_frequence = {x[0]: x[1] for x in words_stat.head(1000).values}

word_frequence_list=[]

for key in word_frequence:

temp = (key, word_frequence[key])

word_frequence_list.append(temp)

# 显示图片

plt.rcParams['figure.figsize'] = (12.0,6.0)

wordcloud = wordcloud.fit_words(dict(word_frequence_list))

plt.imshow(wordcloud) # 以图片形式显示词云

plt.axis('off') # 关闭图像坐标系

plt.show()

要先在cmd命令行中下载wordcloud-->pip install wordcloud

词云图构建思路,是把数据整理出“词云的计数表”,因此要巧妙利用groupby()和agg('counts')函数;或者value_counts亦可

在实际工作中,可能涉及到调整某个词云的大小、词云的形状等,可以通过修改数据,以及自定义图片等形式实现

python中词云图怎样变成特殊图案_如何利用python画出一个多变的词云图?(1)...相关推荐

  1. python正则匹配找到所有的浮点数_如何利用Python抓取静态网站及其内部资源

    遇到的需求 前段时间需要快速做个静态展示页面,要求是响应式和较美观.由于时间较短,自己动手写的话也有点麻烦,所以就打算上网找现成的. 中途找到了几个页面发现不错,然后就开始思考怎么把页面给下载下来. ...

  2. python运算结果是fasls的代码_《利用Python进行数据分析》--整理学习

    第2章(代码示例) path='example.txt' open(path).readline()#只读取文件的第一行.用print函数输出. import json #内置第三方模块将JSON字符 ...

  3. python 抓取微博评论破亿_如果利用Python分析14亿条数据!资深程序员手把手教你!过亿级!...

    挑战 1-gram 的数据集在硬盘上可以展开成为 27 Gb 的数据,这在读入 python 时是一个很大的数据量级.Python可以轻易地一次性地处理千兆的数据,但是当数据是损坏的和已加工的,速度就 ...

  4. python能爬取网站后台数据_如何利用Python爬取网站数据?

    1.基本方法 其实用python爬取网页很简单,只有简单的几句话 这样就可以获得到页面的内容.接下来再用正则匹配去匹配所需要的内容就行了.但是,真正要做起来,就会有各种各样的细节问题. 2.登录 这是 ...

  5. python可以爬取wind数据库吗_如何利用Python来爬取近百万条数据?数据库会炸吧?...

    2.页面分析 发现一共有88万多个问题,再看一下页面的列表规律,我们按照每页最大显示50个问题,一共有17776页,数据非常大 1).页面列表的构建 整个的stackoverflow上关于Python ...

  6. python获取币安k线数据_如何利用Python 爬取币乎的数据

    1LSGO软件技术团队 贡献人:李金原 如果喜欢这里的内容,你能够给我最大的帮助就是转发,告诉你的朋友,鼓励他们一起来学习. If you like the content here, the gre ...

  7. python如何绘制两点间连线_如何利用Python的pyecharts绘制3d柱形图?

    pyecharts绘制3d柱形图要求数据为列表,数据类型为数值型. bar3d.add('',x_axis,y_axis,data,...)中的x_axis,y_axis是文本类型,类别轴,而data ...

  8. java撩妹代码_用C语言画出一个“爱心”,撩妹技能杠杠的

    无意中看到一个,比你这个爱心更酷炫的,都是小爱心汇聚成一个大爱心 代码如下: #include int main() { int  i, j, k, l, m; char c=3; //ASCII码里 ...

  9. python爬虫,Scrapy爬取豆瓣电影《芳华》电影短评,分词生成词云图。

    项目github地址:https://github.com/kocor01/scrapy_cloud Python版本为3.6 自己写的简单架构<python爬虫,爬取豆瓣电影<芳华> ...

最新文章

  1. WCF第一个Demo
  2. 你真的了解WebSocket吗?
  3. UA MATH564 概率论 QE练习题 概率极限理论
  4. python代码创建数据库_python创建数据库代码
  5. 如何將Clonezilla live放到一個已經有其他作業系統存在的硬碟中
  6. JS调用打印机打印Web页面
  7. Asp.Net Core EndPoint 终结点路由工作原理解读
  8. 修改系统默认路径,如收藏夹、桌面、我的文档
  9. ScalavsKotlin
  10. 老身掐指一算,国产游戏“出海”正当时?
  11. 基于yolo5工地安全帽和禁入危险区域识别系统,附数据集
  12. OpenGL ES基本用法
  13. echarts x轴坐标文字显示不全
  14. 新书推荐:可爱的Python
  15. 零值初始化字符串常数作为函数模板参数
  16. C++--第6课 - 专题一经典问题解析
  17. Linux DRM KMS 驱动简介
  18. error LNK2019: 无法解析的外部符号 _WinMain@16
  19. 【论】PISCES: A Programmable, Protocol-Independent Software Switch
  20. Vue app.js文件过大,带宽占用过大,优化方案(持续优化)

热门文章

  1. 【Linux】10_存储管理EXT4文件系统详解
  2. 双NameNode的同步机制
  3. 开源项目成熟度分析工具-利用github api获取代码库的信息
  4. Java 中15种锁的介绍:公平锁,可重入锁,独享锁,互斥锁,乐观锁,分段锁,自旋锁等等...
  5. pyCrypto python 3.5--转
  6. 基于keepalived对redis做高可用配置---转载
  7. 机器学习-数据科学库(第五天)
  8. 第14章 用BERT实现中文语句分类
  9. 开启 Truffle Ganache  MetaMask交互
  10. Airbnb欺诈预测机器学习模型设计:准确率和召回率的故事 发表于2015-07-15 16:14| 3926次阅读| 来源AirBNB/Data| 1 条评论| 作者Ariana Radianto