python配色方案_python 生成18年写过的博客词云
文章链接:https://mp.weixin.qq.com/s/NmJjTEADV6zKdT--2DXq9Q
回看18年,最有成就的就是有了自己的 博客网站,坚持记录,写文章,累计写了36篇了,从一开始的难以下手,到现在成为一种习惯,虽然每次写都会一字一句斟酌,但是每次看到产出,内心还是开心的,享受这样的过程。
这篇文章就是用python 生成自己写的博客词云,平常写的博客都是markdown 格式的,直接把文件传到后台,前端用js去解析文件显示的,所以我这里处理数据就不需要去爬虫网站,直接读文件处理的。
关于生成词云图的,在另外两篇文章中也有介绍过:
python itchat 爬取微信好友信息,生成词云
python爬虫学习:爬虫QQ说说并生成词云图
markdown文件处理,遍历文件夹,匹配md 后缀的文件,读文件,这里的root
是文件夹的绝对路径。
import os
total = ""
file_list = os.listdir(root)
for file in file_list://处理md文件if os.path.splitext(file)[1] == ".md":path = os.path.join(root,file)text = open(path, encoding='utf-8').read()//最终得到的字符串total = total + "n" + text
得到所有的文本之后,使用结巴分词 pip3 install jieba
,处理成单个的词语。
import jieba
wordlist = jieba.cut(total, cut_all=True)
wl = " ".join(wordlist)
因为平常写的文章里有很多的代码,这里可以正则只留下中文,然后再处理中文字符。
import re
rec = re.compile("[^u4E00-u9FA5]")
total = rec.sub("", total)
wordlist = jieba.cut(total, cut_all=True)
wl = " ".join(wordlist)
最后就是生成词云,采用WordCloud
的库
wc = WordCloud(# 设置背景颜色background_color="white",# 设置最大显示的词云数max_words=1000,# 这种字体都在电脑字体中,window在C:WindowsFonts下,mac下的是/System/Library/Fonts/PingFang.ttc 字体font_path='C:WindowsFontsSTFANGSO.ttf',height=2000,width=2000,# 设置字体最大值max_font_size=250,# 设置有多少种随机生成状态,即有多少种配色方案random_state=30,
)
myword = wc.generate(wl) # 生成词云
# 展示词云图
plt.imshow(myword)
plt.axis("off")
wc.to_file('blog.png') # 保存图片
plt.ion()
plt.pause(5)
plt.close() # 图片显示5s,之后关闭
最终的结果显示图,除去代码之后,看这些词,不少还是跟android相关的,也是平常经常会提到的词汇。
欢迎关注我的个人博客:https://www.manjiexiang.cn/
更多精彩欢迎关注微信号:春风十里不如认识你
一起学习,一起进步,欢迎上车,有问题随时联系,一起解决!!!
python配色方案_python 生成18年写过的博客词云相关推荐
- python配色方案_python matplotlib包图像配色方案
可选的配色方案: Accent, Accent_r, Blues, Blues_r, BrBG, BrBG_r, BuGn, BuGn_r, BuPu, BuPu_r, CMRmap, CMRmap_ ...
- python线性回归实例_Python机器学习线性回归分析实例 | kTWO-个人博客
前言 在前面的文章中,我们都是简单的对线性回归模型进行构建,这篇文章我们采用网上下载的数据量比较大的数据来对模型进行构造,最后讲述在线性的情况下如何对模型进行评估. 数据集介绍 下图是该数据集的前10 ...
- 用 Flask 来写个轻博客 (18) — 使用工厂模式来生成应用对象
Blog 项目源码:https://github.com/JmilkFan/JmilkFan-s-Blog 目录 目录 前文列表 工厂模式 使用工厂方法 Factory Method 创建 app 对 ...
- 用 Flask 来写个轻博客 (36) — 使用 Flask-RESTful 来构建 RESTful API 之五
Blog 项目源码:https://github.com/JmilkFan/JmilkFan-s-Blog 目录 目录 前文列表 PUT 请求 DELETE 请求 测试 对一条已经存在的 posts ...
- 用 Flask 来写个轻博客 (35) — 使用 Flask-RESTful 来构建 RESTful API 之四
Blog 项目源码:https://github.com/JmilkFan/JmilkFan-s-Blog 目录 目录 前文列表 POST 请求 身份认证 测试 前文列表 用 Flask 来写个轻博客 ...
- 用 Flask 来写个轻博客 (34) — 使用 Flask-RESTful 来构建 RESTful API 之三
Blog 项目源码:https://github.com/JmilkFan/JmilkFan-s-Blog 目录 目录 前文列表 应用请求中的参数实现 API 分页 测试 前文列表 用 Flask 来 ...
- 用 Flask 来写个轻博客 (33) — 使用 Flask-RESTful 来构建 RESTful API 之二
Blog 项目源码:https://github.com/JmilkFan/JmilkFan-s-Blog 目录 目录 前文列表 扩展阅读 构建 RESTful Flask API 定义资源路由 格式 ...
- 用 Flask 来写个轻博客 (28) — 使用 Flask-Assets 压缩 CSS/JS 提升网页加载速度
Blog 项目源码:https://github.com/JmilkFan/JmilkFan-s-Blog 目录 目录 前文列表 扩展阅读 Flask-Assets 将 Flask-Assets 应用 ...
- 用 Flask 来写个轻博客 (26) — 使用 Flask-Celery-Helper 实现异步任务
Blog 项目源码:https://github.com/JmilkFan/JmilkFan-s-Blog 目录 目录 前文列表 扩展阅读 Celery 将 Celery 加入到应用中 实现向新用户发 ...
- 用 Flask 来写个轻博客 (25) — 使用 Flask-Principal 实现角色权限功能
Blog 项目源码:https://github.com/JmilkFan/JmilkFan-s-Blog 目录 目录 前文列表 扩展阅读 Flask-Principal 使用 Flask-Princ ...
最新文章
- 如何判断模糊图像_图像翻译三部曲:pix2pix, pix2pixHD, vid2vid
- 全国大学生智能车竞赛赛场准备好,就等同学们入驻展示
- Mybatis批量添加对象List
- 并行编程——工程实践
- Python:初始函数
- 扒一扒TCP协议与UDP协议
- 关于:程序兼容多种数据库
- 搜索推荐项目EFLS开源 | 阿里妈妈联邦学习解决方案详解
- sql 系统 存储过程的使用方法 转载
- Win10预览版之BUG
- 屏幕录制大师转换方法
- xp电脑怎样连接无线网络连接服务器,xp笔记本电脑怎么连接无线网wifi呢
- 1.13正版服务器,我的世界Minecraft梦幻世界服务器(1.7-1.13版本)
- 看了阿里找数据分析师的新规则,真让人头皮发麻!
- OpenCV视频篇——颜色跟踪
- 让WINDOWS XP自动登陆
- Qt中disconnect断开和blockSignals阻塞的总结
- 为什么apt-get update 要与apt-get install 在一起
- 高等工程数学 —— 第一章 (2)矩阵的谱半径与条件数
- KEIL5工具栏的设置
热门文章
- Transformer在图像复原领域的降维打击!ETH提出SwinIR:各项任务全面领先
- 特征点检测-SIFT
- java.lang.ClassFormatError
- xUtils3 联网模块
- 假定CSomething是一个类,执行下面这些语句之后,内存里创建了____个CSomething对象。...
- android夸项目调用
- android开发之自定义AutoCompleteTextView
- 添加鼠标悬浮在控件上的提示信息 很齐全各种方法 MFC ToolTipCtl
- 适合自己的才是最好的
- 跟我一起学C++课程笔记(第一天)