最近由于大屏项目需要生成一个词云所以这边做个记录

demo.py下:

from os import path

import chnSegment

import plotWordcloud

if __name__ == '__main__':

# 读取文件

d = path.dirname(__file__)

# text = open(path.join(d, 'doc//十九大报告全文.txt')).read()

text = open(path.join(d, 'doc//临汾2019.txt'), encoding='utf-8').read()

# text="付求爱很帅并来到付求爱了网易研行大厦很帅 很帅 很帅"

# 若是中文文本,则先进行分词操作

text = chnSegment.word_segment(text)

print(text)

# 生成词云

plotWordcloud.generate_wordcloud(text)

chnSegment.py下 这边主要对文章进行了一个分词:

from collections import Counter

from os import path

import jieba

jieba.load_userdict(path.join(path.dirname(__file__), 'userdict//userdict.txt')) # 导入用户自定义词典

def word_segment(text):

'''

通过jieba进行分词并通过空格分隔,返回分词后的结果

'''

# 计算每个词出现的频率,并存入txt文件

jieba_word = jieba.cut(text, cut_all=False) # cut_all是分词模式,True是全模式,False是精准模式,默认False

data = []

for word in jieba_word:

# print(word)

data.append(word)

dataDict = Counter(data)

with open('doc//词频统计.txt', 'w') as fw:

for k, v in dataDict.items():

fw.write("%s,%d\n" % (k, v))

# fw.write("%s"%dataDict)

# 返回分词后的结果

jieba_word = jieba.cut(text, cut_all=False) # cut_all是分词模式,True是全模式,False是精准模式,默认False

seg_list = ' '.join(jieba_word)

# print(seg_list)

return seg_list

plotWordcloud.py文件下 进行生成词云

from os import path

from PIL import Image

import numpy as np

import matplotlib.pyplot as plt

from matplotlib import colors

from wordcloud import WordCloud, STOPWORDS

import wordcloud

def generate_wordcloud(text):

'''

输入文本生成词云,如果是中文文本需要先进行分词处理

'''

# 设置显示方式

d = path.dirname(__file__)

color_list = ['#FF0000', '#FF6347', '#0000FF', '#00FF7F', '#FFD700'] # 建立颜色数组

colormap = colors.ListedColormap(color_list) # 调用

alice_mask = np.array(Image.open(path.join(d, "Images//timg.jpg")))

image_colors = wordcloud.ImageColorGenerator(alice_mask)

font_path = path.join(d, "font//FZSTK.TTF")

stopwords = set(STOPWORDS)

wc = WordCloud(

background_color=None, # 设置背景颜色

mode="RGBA",

max_words=2000, # 词云显示的最大词数

mask=alice_mask, # 设置背景图片

stopwords=stopwords, # 设置停用词

font_path=font_path, # 兼容中文字体,不然中文会显示乱码

# colormap=colormap, # 设置颜色

color_func=image_colors,

# scale=32,

# margin=1,

)

# 生成词云

wc.generate(text)

# 生成的词云图像保存到本地

wc.to_file(path.join(d, "Images//alice.png"))

# 显示图像

plt.imshow(wc, interpolation='bilinear')

# interpolation='bilinear' 表示插值方法为双线性插值

plt.axis("off") # 关掉图像的坐标

plt.show()

爱心 python 词云_爱心 python 词云_python 词云相关推荐

  1. python 时间序列预测_使用Python进行动手时间序列预测

    python 时间序列预测 Time series analysis is the endeavor of extracting meaningful summary and statistical ...

  2. python 概率分布模型_使用python的概率模型进行公司估值

    python 概率分布模型 Note from Towards Data Science's editors: While we allow independent authors to publis ...

  3. python scale()函数_【Python菜鸟进阶大神】Matplotlib数据可视化007:词云

    词云是对网络文本中出现频率较高的关键词予以视觉上的突出,形成关键词云层或关键词渲染,从而过滤掉大量的文本信息,使读者只要一眼扫过文本就可以领略文本的主旨. 词云用Python是怎么实现的.用wordc ...

  4. python color属性_使用Python制作一个带GUI界面的词云自动生成工具(连载七)

    前几篇向大家介绍了词云自动生成工具(GUI)的详解GUI词云自动生成工具中词云属性设置界面的实现(连载六).通过前面内容我们基本构建出了词云自动生成工具的主要框架.本篇结合tkinter中的filed ...

  5. python爬取歌词生成词云图_爬取毛不易歌词作词云展示

    爬取毛不易歌词作词云展示 今天我们做一个数据可视化的项目,爬取毛不易的歌词做词云展示. 1.爬取数据 我们主要使用 Python 爬虫获取 HTML,用 XPath 对歌曲的 ID.名称进行解析,然后 ...

  6. python怎样安装词云_在python中怎样安装词云-女性时尚流行美容健康娱乐mv-ida网...

    女性时尚流行美容健康娱乐mv-ida网 mvida时尚娱乐网 首页 美容 护肤 化妆技巧 发型 服饰 健康 情感 美体 美食 娱乐 明星八卦 首页 > 高级搜索 腾讯qq 云 词典正式发布无需下 ...

  7. python弹幕好坏词分析_用python分析一波哔哩哔哩弹幕

    又差不多到了过年的的时候咯.不知道几年的b站拜年祭会怎么样呢? 这时让我想起了B站第一次的拜年祭,如果我没记错的话第一次拜年祭是在2015年吧.我当初也是和大伙一起看了的. 最近无聊去看了看,发现视频 ...

  8. python快速生成文字云_在Python中创建文字云或标签云

    作者|ISHA5 编译|Flin 来源|analyticsvidhya 介绍 从开始从事数据可视化工作的那一天起,我就爱上它了.我总是喜欢从数据中获得有用的见解. 在此之前,我只了解基本图表,例如条形 ...

  9. 阿里云服务器搭建python web环境_《Python入门》Linux 下 Python Web开发环境搭建笔记-阿里云开发者社区...

    之前写过 Windows 7下Python Web开发环境搭建笔记,今天写一下在Linux系统下搭建Python Web的开发测试环境. 我使用的系统是:ubuntu 14.04 server,根据个 ...

  10. python网课阿里云_关于python视频教程的阿里云网站内容

    {"moduleinfo":{"list_count":[{"count_phone":21,"count":21}], ...

最新文章

  1. 非root用户加入docker用户组省去sudo
  2. arcgis 点坐标python_Python写的arcgis中点坐标txt转面状shp的小程序
  3. Spring-IOC之BeanDefinitionHolder
  4. php 匹配div正则表达式,Php正则表达式匹配div
  5. java map原理_Java HashMap底层原理分析
  6. I/O多路复用技术是什么?
  7. IOS NSUserDefaults 讲解 用法
  8. linux qt 甘特图,qt绘制甘特图
  9. java输入方法有哪些内容_java中输入一个字符的方法有哪些
  10. python把经纬度生成shp,利用Python实现Shp格式向GeoJSON的转换方法
  11. npm下载和使用(超详细)
  12. html从入门到精通(全)
  13. 关于富文本编辑器froala editor和百度Ueditor使用问题
  14. 车架号VIN码识别api接口-vin码OCR识别-车辆识别代码识别-汽车vin码图片识别
  15. [ps视频教程][ps6 完全自学教程][iso/pdf/2.7G]
  16. python之获取文件当前位置和定位某个位置
  17. python求一元三次方程的根_一元高次方程寻根记杂谈
  18. Gameplay Ingredients
  19. docker 常用命令(二)——容器命令
  20. win10笔记本上插耳机没有声音,插耳机不被检测

热门文章

  1. intel bsf指令
  2. 考公历程 #1 学习笔记
  3. 本题要求实现一个函数,对给定平面任意两点坐标(x 1​ ,y 1​ )和(x 2​ ,y 2​ ),求这两点之间的距离。
  4. Delphi 2010正式版下载(RAD Studio 2010下载)
  5. 2.2吴恩达深度学习笔记之优化算法
  6. anaconda:一直处于adding featured channel状态
  7. 配置 FoxyProxy 规则自由切换代理模式
  8. c语言函数嵌套是啥,函数的嵌套是什么 函数的嵌套是什么意思
  9. 数据库 物化视图详解
  10. Oracle物化视图的使用总结