近期,学校对呼和浩特市第二中学学生特质进行了调查,具体题目为“用关键词描述一下二中学生的特质(尽量在20字以内)".

为了更好的展示调查结果,我们基于Python的jieba库和wordcloud库进行了数据可视化统计分析。

第一步:统计词频

import jieba

import wordcloud

import matplotlib.pyplot as plt

w=wordcloud.WordCloud()

d=("C:\\Users\\Administrator\\Desktop\\a.txt")

f=open(d,"r")

# 生成对象

a=list(jieba.cut(f.read()))

c={}

for w in a:

if len(w)==1:

continue

else:

c[w]=c.get(w,0)+1

it=list(c.items())

it.sort( key=lambda x:x[1], reverse=True)

for i in range(30):

print(it[i][0],it[i][1])

具体结果如下:

第二步:生成云图

import jieba

import wordcloud

import matplotlib.pyplot as plt

w=wordcloud.WordCloud()

d=("C:\\Users\\Administrator\\Desktop\\a.txt")

f=open(d,"r")

ff=jieba.cut(f.read())

cc="".join(ff)

wc=w.generate(cc)

w.to_file("pywordcloud.png")

plt.figure(dpi=1000) #通过这里可以放大或缩小

plt.imshow(wc, interpolation='catrom',vmax=1000)

plt.axis("off") #隐藏坐标

生成结果如下:

python词频作图_基于Python的词频分析与云图生成相关推荐

  1. python 英语分词_基于Python NLTK库进行英文文本预处理

    文本预处理是要文本处理成计算机能识别的格式,是文本分类.文本可视化.文本分析等研究的重要步骤.具体流程包括文本分词.去除停用词.词干抽取(词形还原).文本向量表征.特征选择等步骤,以消除脏数据对挖掘分 ...

  2. python编码尺寸_基于Python批量生成指定尺寸缩略图代码实例

    这篇文章主要介绍了基于Python批量生成指定尺寸缩略图代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 最近我们商城上架的应用越来越丰富了. ...

  3. cv2 python 获取斑马线_基于python的opencv图像处理实现对斑马线的检测示例

    基本思路 斑马线检测通过opencv图像处理来进行灰度值转换.高斯滤波去噪.阈值处理.腐蚀和膨胀后对图像进行轮廓检测,通过判断车辆和行人的位置,以及他们之间的距离信息,当车速到超过一定阈值时并且与行人 ...

  4. 基于python爬虫数据处理_基于Python爬虫的校园数据获取

    苏艺航 徐海蛟 何佳蕾 杨振宇 王佳鹏 摘要:随着移动时代的到来,只适配了电脑网页.性能羸弱的校园教务系统,已经不能满足学生们的移动查询需求.为此,设计了一种基于网络爬虫的高实用性查询系統.它首先通过 ...

  5. 基于python的网站_基于Python的网站爬虫应用研究

    基于 Python 的网站爬虫应用研究 陈清 [期刊名称] <通讯世界> [年 ( 卷 ), 期] 2020(027)001 [摘要] 如何于海量的互联网网站中获取有用资源信息 , 对网站 ...

  6. python点名代码_基于python tkinter的点名小程序功能的实例代码

    基于python tkinter的点名小程序功能的实例代码,花名册,次数,窗口,未找到,初始化 基于python tkinter的点名小程序功能的实例代码 易采站长站,站长之家为您整理了基于pytho ...

  7. python traceback 丢失_基于python traceback实现异常的获取与处理

    这篇文章主要介绍了基于python traceback实现异常的获取与处理,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 1.traceback.p ...

  8. python 赋值方法_基于Python List的赋值方法

    Python中关于对象复制有三种类型的使用方式,赋值.浅拷贝与深拷贝.他们既有区别又有联系,刚好最近碰到这一类的问题,研究下. 一.赋值 在python中,对象的赋值就是简单的对象引用,这点和C++不 ...

  9. python 量化交易_基于Python的量化交易工具清单(上)

    -- Python量化工具清单 -- 以下内容来源于Wilson Freitas的Github项目"Awesome Quant".原文中包含了丰富的语言类别,但是后续介绍主要针对P ...

最新文章

  1. kettle kafka mysql_kettle使用kafka组件消费数据,保存到资源库无法打开问题
  2. 【Python】编程笔记3
  3. tomcat默认用户名密码修改
  4. 软件项目管理:进度管理相关概念介绍
  5. shell中source与sh区别
  6. pc显示器分辨率 前端_2020电竞显示器推荐
  7. Android 系统(236)---了解 64 位版本
  8. 洛谷P2617 Dynamic Rankings
  9. 全网首发:JDK绘制文字:四、绘制文字的具体函数分析
  10. VMware+WinDBG_配置_资料
  11. 微信公众号支付接口php代码,关于微信支付PHP SDK之微信公众号支付实现代码
  12. SSIS变量如何获取当前的系统时间(字符串格式年月日)
  13. 安卓手机模拟路由器 测试WIFI信道遍历
  14. GPS 入门 5 —— 定位误差产生的原因和差分定位原理 (转)
  15. 【Phabricator】教科书一般的Phabricator安装教程(配合官方文档并带有踩坑解决方案)...
  16. IGRP和EIGRP为什么是距离矢量协议
  17. [生命科学] 生物基础实验之DNA提取
  18. 学人工智能有前途吗?人工智能前景-AI就业方向
  19. bandersnatch报错No module Named的解决办法
  20. Springcloud架构

热门文章

  1. NeurIPS 2020 :新一代算法“鉴黄师”诞生,中科院计算所研究生一作
  2. 去年秋招,我学长拿了7个Offer,他是怎么做到的?
  3. 2020年,计算机视觉领域会有哪些新的研究方向值得提前探索?
  4. 让你的 IDEA 好用到飞起来的配置
  5. 将LSTM与word2vec结合实现中文自动写作
  6. 爬虫之selenium替换user-agent
  7. 汇编语言 执行push和执行pop区别 栈顶的变化范围
  8. 聚类:基本概念和方法
  9. OSI第一层:物理层功能及作用(详解与解释)
  10. 面向高精度领域的视觉伺服算法汇总