一、问题描述


以上数据是会员的每一笔消费,我想看部类的词云图。
词云图有两种做法:
第一种是针对文本的,就是一堆话,先jieba分词,然后在进行词云图的绘制;
第二种就是根据已知的词频进行绘制,这就正好可以符合我的需求,我可以先把部类进行计算,求每个部类出现的次数,一定要再把每个部类和次数转化为字典的键值对形式,再进行词云图的绘制。

二、代码

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 要先pip install wordcloud
from wordcloud import WordCloud
# 获得数据
data=pd.read_excel('C:\\Users\\02180085\\Desktop\\回店会员特征\\电商数据前期消费明细.xlsx',sheet_name='元数据')
# 求频次
data_gr=data.groupby(by='部类',as_index=False).agg({'卡号':len})
# print(data_gr)
# 转化为字典形式
dic=dict(zip(data_gr['部类'],data_gr['卡号']))
# print(dic)#fit_word函数,接受字典类型,其他类型会报错
wordcloud = WordCloud(font_path='simhei.ttf',background_color="white",width =4000,height= 2000,margin= 10 ).fit_words(dic)
plt.imshow(wordcloud)
# 显示
plt.show()

二、结果

字体越大,出现的频率越高

关于词云图的参考,见以下链接,讲的很详细,特别是各个参数的设置:
https://blog.csdn.net/moshanghuali/article/details/84667136

Python 每日一记217根据词频生成词云图相关推荐

  1. python爬取《三国演义》小说统计词频生成词云图

    python爬取<三国演义>小说&统计词频&生成词云图 注意点: 爬取小说正文时用的正则表达式涉及到多行匹配.需要开启多行模式(?s) book_content_re = ...

  2. 使用Python将《青花瓷》歌词生成词云图

    哈喽大家好,因为上次有小伙伴问我,歌曲的歌词和评论怎么生成词云图,想买代码- 当时我就拒绝了,直接免费送给了他. 所以今天来分享给大家 我们以周董的<青花瓷>为例,要对<青花瓷> ...

  3. Python玩转微信 个性签名生成词云图

    本博客代码参照http://www.cnblogs.com/jiaoyu121/p/6944398.html. 运行如下代码之前,将下图的wechat.jpg放入F盘下,需安装itchat.jieba ...

  4. [转载]Python爬取豆瓣影评并生成词云图代码

    # -*- coding:utf-8 -*- ''' 抓取豆瓣电影某部电影的评论 这里以<我不是潘金莲为例> 网址链接:https://movie.douban.com/subject/2 ...

  5. 第100篇博客——用Python爬取我前99篇博客内容,分词并生成词云图

    这是我的第100篇博客,从2016年7月1日发表第一篇博客至今,也有两个多年头了. 回首自己前99篇博客,各种类型都有,有技术总结,有随感,有读书笔记,也有BUG修改.内容千奇百怪,质量参差不齐,篇幅 ...

  6. wordcloud生成词云图(含形状、颜色设置)

    一.导入和主要方法 1.导入wordcloud包 生成词云图之后还要显示出来,所以还会用到matplotlib 如果要设置mask蒙版,还需要从imageio导入imread()函数 如果需要设置词云 ...

  7. Python生成词云图,TIIDF方法文本挖掘: 词频统计,词云图

    python中使用wordcloud包生成的词云图. 下面来介绍一下wordcloud包的基本用法. class wordcloud.WordCloud(font_path=None, width=4 ...

  8. 利用Python分析文章词频,并生成词云图

    利用Python分析文章词频,并生成词云图 使用request模块获取文章数据 import jieba import requests import csv from bs4 import Beau ...

  9. python爬音乐评论生成词云图_python爬虫+词云图,爬取网易云音乐评论

    又到了清明时节,用python爬取了网易云音乐<清明雨上>的评论,统计词频和绘制词云图,记录过程中遇到一些问题 爬取网易云音乐的评论 一开始是按照常规思路,分析网页ajax的传参情况.看到 ...

最新文章

  1. 华为hybrid-vlan
  2. Java Script学习 4(转)
  3. 【Flutter】Hero 动画 ( Hero 动画使用流程 | 创建 Hero 动画核心组件 | 创建源页面 | 创建目的页面 | 页面跳转 )
  4. C++学习笔记-----继承体系中函数的重载,覆盖和隐藏的区别
  5. Windows 7 Ultimate + Ubuntu 12.04 LTS双系统完美走起
  6. vue-cli中理不清的assetsSubDirectory 和 assetsPublicPath
  7. 阿里云原生专家洛浩:详解Serverless的起源、发展和落地实践
  8. 正交矩阵和旋转矩阵之间关系和性质总结
  9. 计算机视觉论文-2021-07-14
  10. 基于机器学习的“能源之星”得分预测的完整演练
  11. 2017-2021书单5周年 |读书总结、读书方法论、知识体系搭建、效率工具推荐系列文章(1)δ星 丨读书笔记与书单 notes...
  12. ios开发学习- 简易音乐播放器2 (基于iPhone4s屏幕尺寸)-- 歌词解析--plist文件应用--imageNamed图片加载耗内存...
  13. Android:启动流程
  14. asp.net mvc 连接sqlserver数据库
  15. mysql的时间模糊chax_MySQL™ 参考手册(通用安装指南)
  16. centos6 trouble shooting
  17. ADS-B接收机Radarcape支持多点定位MLAT(选配acars)
  18. 诸侯安置(暴力搜索)
  19. 香港大学计算机授课型硕士(MSc)申请经验分享
  20. unity解锁_Unity与PiXYZ软件合作以解锁CAD数据以进行实时开发

热门文章

  1. Win10自带录屏怎么用?一键开启,超级简单!
  2. 机械键盘知识漫谈(一)- 初级篇
  3. [闻缺陷则喜]编码与实现方式
  4. 数字华容道 逆时针
  5. 猎鹰9号运载火箭介绍
  6. PHP设计模式-简单工厂方法
  7. Cadence Allegro 17.4学习记录开始06-PCB Editor 17.4快捷键的说明和中英文的切换和操作界面放大缩小设置
  8. PostgreSQL的streaming replication
  9. php 自定义排序,thinkphp6.0自定义排序order by field
  10. 怎么关闭win10虚拟机服务器,win10系统彻底关闭退出vmware虚拟机的步骤