python英文词云代码_使用python实现个性化词云的方法
先上图片
词云图
需要模板
pip install jieba
pip install wordcloud
还需要安装另外两个东西这两个我也不太懂借鉴百度写上去的
pip install scipy
pip install matplotlib
因为用ubuntu系统所有没有windows那么麻烦,也没有那么多报错
看到好多人制作自己的词云有没有一丝丝的激动啊,有激动就要马上去做,冲动才是第一创造力。
jieba是一款很恨很好用的中文分词模板
jeiba中文文档
至于wordcloud没有中文文档不过咱会猜啊,英文不好咱们可以猜啊,查看源代码猜。
先把我全部代码贡献上来
#-*-coding:utf-8—-*-
import jieba.analyse
from wordcloud import WordCloud,ImageColorGenerator
from scipy.misc import imread
import matplotlib.pyplot as plt
class wc:
def __init__(self,txt_file,img_file,font_file):
self.f = open(txt_file,'r')
self.txt = self.f.read()
self.f.close()
self.tags = jieba.analyse.extract_tags(self.txt,topK=100)
#topK说白了就是返回几个关键词
self.text = ' '.join(self.tags) #把分词链接起来,加空格因为英文靠空格分词
self.img = imread(img_file)
self.wc = WordCloud(font_path=font_file,background_color='white',max_words=100,mask=self.img,max_font_size=80)
###直接在这里进行猜###
#font_path指的是字体文件路径,因为wordcloud自带的字体不支持中文所以我们要指定一个字体文件,否者输出的图片全是框框
#background_color 默认是黑色 我设置成白色
#max_words最大显示的词数
#mask 背景图片
#max_font_size 最大字体字号
self.word_cloud = self.wc.generate(self.text)
def show_wc(self):
#img_color = ImageColorGenerator(self.img)
plt.imshow(self.word_cloud)
#可以通过 plt.imshow(self.wc.recolor(color_func=img_color))使图片颜色跟字体颜色一样
plt.axis("off")
plt.show()
if __name__=='__main__':
mywc = wc('sanwen.txt','out.png','font.ttc')
mywc.show_wc()
使用wc.recolor(color_func=img_color)
本文标题: 使用python实现个性化词云的方法
本文地址: http://www.cppcns.com/jiaoben/python/193839.html
python英文词云代码_使用python实现个性化词云的方法相关推荐
- python画pr曲线代码_利用Python中的numpy包实现PR曲线和ROC曲线的计算
闲来无事,边理解PR曲线和ROC曲线,边写了一下计算两个指标的代码.在 python 环境下,sklearn里有现成的函数计算ROC曲线坐标点,这里为了深入理解这两个指标,写代码的时候只用到numpy ...
- python编写高质量代码_用 Python 编写干净、可测试、高质量的代码
用 Python 编写干净.可测试.高质量的代码 Noah Gift 2010 年 12 月 20 日发布 简介 编写软件是人所承担的最复杂的任务之一.AWK 编程语言和 "K and R ...
- python推箱子游戏代码_用python入门知识做推箱子游戏,若能打过第三关,则可以学会编程...
不得不说,Python小游戏是最适合入门编程的项目,因为太简单! 无论懂或完全不懂python,这样的小游戏,你都可以直接开发出来,原因很简单: 在详细教程里,会有从零基础开始,一步一步的教你完成这个 ...
- python爬取文献代码_使用python爬取MedSci上的影响因子排名靠前的文献
使用python爬取medsci上的期刊信息,通过设定条件,然后获取相应的期刊的的影响因子排名,期刊名称,英文全称和影响因子.主要过程如下: 首先,通过分析网站http://www.medsci.cn ...
- python名片打印程序代码_基于Python的名片识别接口调用代码实例
#!/usr/bin/python # -*- coding: utf-8 -*- import json, urllib from urllib import urlencode #-------- ...
- python迷宫小游戏代码_用 Python 写个消消乐小游戏
提到开心消消乐这款小游戏,相信大家都不陌生,其曾在 2015 年获得过玩家最喜爱的移动单机游戏奖,受欢迎程度可见一斑,本文我们使用 Python 来做个简单的消消乐小游戏. 很多人学习python,不 ...
- python绘制繁花曲线代码_使用python和pygame绘制繁花曲线的方法
前段时间看了一期<最强大脑>,里面各种繁花曲线组合成了非常美丽的图形,一时心血来潮,想尝试自己用代码绘制繁花曲线,想怎么组合就怎么组合. 真实的繁花曲线使用一种称为繁花曲线规的小玩意绘制, ...
- python怎么运行matlab代码_用python运行matlab代码
我得到了一个错误:Traceback (most recent call last): File "", line 1, in File "C:\Users\XYZ\Ap ...
- python 打卡记录代码_利用Python实现对考勤打卡数据处理的总结
利用Python实现对考勤打卡数据处理的总结 一.背景交代 二.说明 三. 8种方法 1. 查看文件是否存在 2. 导入excel文件,并把数据保存为dataframe格式 3. 计算程序运行时间 4 ...
最新文章
- java 字符串xml,解析java中的xml字符串?
- 小程序商城制作,轻松打造自己的会员系统
- 大型神经网络可能初具意识:OpenAI首席科学家引争议,众大佬吵成一团
- 在Eclipse中配置Tomcat服务
- labview 软件编程规范
- C++socket编程(七):7.4 正则表达式分析用户请求
- slam无人车清除地图残影
- Java基础(静态static)
- python多线程和多进程
- Linux之父十大名言
- 什么是PY平台?Python平台用途及安装的详细方法
- PHP多功能自动发卡平台源码带手机版 带多套商户模板
- ShineDisk M667固态修复记录 慧荣SM2258XT开卡量产工具
- python+selenium+autoit实现自动百度识图
- 网站服务器配置在哪里设置,web服务器配置参数 web服务器建立网站具体步骤
- 一台显示器分成双屏_双屏办公,用起来到底有多爽
- python ipad协议_python – 实现AirDrop协议
- 【低功耗蓝牙】③ 蓝牙服务和特性的创建
- Jenkins集成Gitlab实现自动化部署
- 圣天诺 加密java_圣天诺Sentinel LDK 7.8壳加密的编译环境是什么?
热门文章
- qt 实现 以图片为中心 让它旋转_QT图片旋转动画
- 对象 普通po转_厦门2020年转学怎么转?需要什么材料?你想知道的答案都在这!......
- ldap radius mysql_radius vs ldap
- android程序启动动画,Android设置软件启动动画(以及初次安装的几张引导图)
- linux 内核编号含义_如何阅读linux内核代码?
- P6364 1024 程序员节发橙子(贪心+前缀和)
- ROS2学习(三).ROS2环境配置
- ap协议java_AP计算机科学A:Java编程类和对象
- 『设计模式』职责链模式(Chain of Responsibility) 可怜的加薪、请假之路
- 数学--数论--POJ 1061青蛙的约会 (扩展欧几里得算法)