python中词云图怎样变成特殊图案_如何利用python画出一个多变的词云图?(1)...
问题描述:
如何利用python画出一个多变的词云图?
解决方法:import numpy as np
import matplotlib
import matplotlib.pyplot as plt
from wordcloud import WordCloud
plt.figure(figsize = (12,8))
%matplotlib inline
plt.rcParams['axes.unicode_minus'] = False
test=['a','b','c','d','a','b']*10+['e','f','g','h','i','j','k']*3+['l','m','n','o','p','q','r','s','t']
words_df=pd.DataFrame({'words':test})
words_df.head()
words_stat=words_df.groupby(by=['words'])['words'].agg({'counts':np.size});
words_stat
words_stat = words_stat.reset_index().sort_values(by=['counts'], ascending=False)
words_stat
# 生成词云图,WordCloud默认不支持中文,需要自己下载好中文字库
wordcloud = WordCloud(font_path="simhei.ttf", background_color="white", max_font_size=80)
word_frequence = {x[0]: x[1] for x in words_stat.head(1000).values}
word_frequence_list=[]
for key in word_frequence:
temp = (key, word_frequence[key])
word_frequence_list.append(temp)
# 显示图片
plt.rcParams['figure.figsize'] = (12.0,6.0)
wordcloud = wordcloud.fit_words(dict(word_frequence_list))
plt.imshow(wordcloud) # 以图片形式显示词云
plt.axis('off') # 关闭图像坐标系
plt.show()
要先在cmd命令行中下载wordcloud-->pip install wordcloud
词云图构建思路,是把数据整理出“词云的计数表”,因此要巧妙利用groupby()和agg('counts')函数;或者value_counts亦可
在实际工作中,可能涉及到调整某个词云的大小、词云的形状等,可以通过修改数据,以及自定义图片等形式实现
python中词云图怎样变成特殊图案_如何利用python画出一个多变的词云图?(1)...相关推荐
- python正则匹配找到所有的浮点数_如何利用Python抓取静态网站及其内部资源
遇到的需求 前段时间需要快速做个静态展示页面,要求是响应式和较美观.由于时间较短,自己动手写的话也有点麻烦,所以就打算上网找现成的. 中途找到了几个页面发现不错,然后就开始思考怎么把页面给下载下来. ...
- python运算结果是fasls的代码_《利用Python进行数据分析》--整理学习
第2章(代码示例) path='example.txt' open(path).readline()#只读取文件的第一行.用print函数输出. import json #内置第三方模块将JSON字符 ...
- python 抓取微博评论破亿_如果利用Python分析14亿条数据!资深程序员手把手教你!过亿级!...
挑战 1-gram 的数据集在硬盘上可以展开成为 27 Gb 的数据,这在读入 python 时是一个很大的数据量级.Python可以轻易地一次性地处理千兆的数据,但是当数据是损坏的和已加工的,速度就 ...
- python能爬取网站后台数据_如何利用Python爬取网站数据?
1.基本方法 其实用python爬取网页很简单,只有简单的几句话 这样就可以获得到页面的内容.接下来再用正则匹配去匹配所需要的内容就行了.但是,真正要做起来,就会有各种各样的细节问题. 2.登录 这是 ...
- python可以爬取wind数据库吗_如何利用Python来爬取近百万条数据?数据库会炸吧?...
2.页面分析 发现一共有88万多个问题,再看一下页面的列表规律,我们按照每页最大显示50个问题,一共有17776页,数据非常大 1).页面列表的构建 整个的stackoverflow上关于Python ...
- python获取币安k线数据_如何利用Python 爬取币乎的数据
1LSGO软件技术团队 贡献人:李金原 如果喜欢这里的内容,你能够给我最大的帮助就是转发,告诉你的朋友,鼓励他们一起来学习. If you like the content here, the gre ...
- python如何绘制两点间连线_如何利用Python的pyecharts绘制3d柱形图?
pyecharts绘制3d柱形图要求数据为列表,数据类型为数值型. bar3d.add('',x_axis,y_axis,data,...)中的x_axis,y_axis是文本类型,类别轴,而data ...
- java撩妹代码_用C语言画出一个“爱心”,撩妹技能杠杠的
无意中看到一个,比你这个爱心更酷炫的,都是小爱心汇聚成一个大爱心 代码如下: #include int main() { int i, j, k, l, m; char c=3; //ASCII码里 ...
- python爬虫,Scrapy爬取豆瓣电影《芳华》电影短评,分词生成词云图。
项目github地址:https://github.com/kocor01/scrapy_cloud Python版本为3.6 自己写的简单架构<python爬虫,爬取豆瓣电影<芳华> ...
最新文章
- WCF第一个Demo
- 你真的了解WebSocket吗?
- UA MATH564 概率论 QE练习题 概率极限理论
- python代码创建数据库_python创建数据库代码
- 如何將Clonezilla live放到一個已經有其他作業系統存在的硬碟中
- JS调用打印机打印Web页面
- Asp.Net Core EndPoint 终结点路由工作原理解读
- 修改系统默认路径,如收藏夹、桌面、我的文档
- ScalavsKotlin
- 老身掐指一算,国产游戏“出海”正当时?
- 基于yolo5工地安全帽和禁入危险区域识别系统,附数据集
- OpenGL ES基本用法
- echarts x轴坐标文字显示不全
- 新书推荐:可爱的Python
- 零值初始化字符串常数作为函数模板参数
- C++--第6课 - 专题一经典问题解析
- Linux DRM KMS 驱动简介
- error LNK2019: 无法解析的外部符号 _WinMain@16
- 【论】PISCES: A Programmable, Protocol-Independent Software Switch
- Vue app.js文件过大,带宽占用过大,优化方案(持续优化)
热门文章
- 【Linux】10_存储管理EXT4文件系统详解
- 双NameNode的同步机制
- 开源项目成熟度分析工具-利用github api获取代码库的信息
- Java 中15种锁的介绍:公平锁,可重入锁,独享锁,互斥锁,乐观锁,分段锁,自旋锁等等...
- pyCrypto python 3.5--转
- 基于keepalived对redis做高可用配置---转载
- 机器学习-数据科学库(第五天)
- 第14章 用BERT实现中文语句分类
- 开启 Truffle Ganache MetaMask交互
- Airbnb欺诈预测机器学习模型设计:准确率和召回率的故事 发表于2015-07-15 16:14| 3926次阅读| 来源AirBNB/Data| 1 条评论| 作者Ariana Radianto