微信聊天记录的词云制作

  • 需求
    • 导出微信聊天记录
    • 提取文字聊天记录
    • 生成词云

需求

想把跟朋友的微信聊天记录做个词云

导出微信聊天记录

我的手机是iphone,用旧版的itunes备份手机全部信息
itunes链接: https://pan.baidu.com/s/1giEHdo3r7flNHP2Brt1euw 提取码: fxma
ps:备份花的时间有点多

提取文字聊天记录

备份完成后,使用工具导出微信聊天记录

工具下载网站:http://wxbackup.imxfd.com/
大神原帖:https://zhuanlan.zhihu.com/p/32511173
百度云备份:https://pan.baidu.com/s/1ST22cM485cjR-ZiGW_nlqg 提取码: fqvf

wxbackup这个工具,需要手动指定备份文件的目录,itunes默认备份路径是
C:\Users\{Username}\AppData\Roaming\Apple Computer\MobileSync\Backup
{Username}需要替换成自己的用户名称


导出的文件包含image,video,js,css等文件夹,其中文字聊天记录在js的message.js中
可以先将js文件另存为txt,然后提取出中文

with open("F:\message.txt", 'r', encoding='utf-8') as f:content = f.read()# 提取中文
text = [s for s in content if '\u4e00' <= str(s) <= '\u9fff']# 拼接成字符串
_text = ""
for i in text:_text = _text + ''.join(i)# 写入新文件
with open("F:\_message.txt", 'w', encoding='utf-8') as f:f.write(_text)

PS:这里比较懒,提取之后手动删掉了双方的微信昵称

生成词云

这里用到了wordcloud、jieba跟imageio,先进行安装

pip install wordcloud -i https://mirrors.aliyun.com/pypi/simple/
pip install jieba -i https://mirrors.aliyun.com/pypi/simple/
pip install imageio -i https://mirrors.aliyun.com/pypi/simple/
#coding:utf-8import imageio
from wordcloud import WordCloud
import jiebatext_from_file_with_apath = open('F:\_message.txt', 'r', encoding='utf-8').read()wordlist = jieba.cut(text, cut_all=True)
word_split = " ".join(wordlist)wc = WordCloud(background_color="whit",  # 背景颜色max_words=2000,  # 显示最大词数font_path="C:/Windows/Fonts/simfang.ttf",  # 使用字体,否则生成的词云图片会显示乱码min_font_size=15,max_font_size=50,width=400,height=860,margin=5,mask=imageio.imread("F:/1.png")  # 图幅宽度
)
wc.generate(word_split)
wc.to_file('F:/聊天词云'+".png")

1.png

效果图:
不加mask参数

添加mask参数

微信聊天记录的词云制作相关推荐

  1. 【微信聊天记录制作词云】超详细保姆级教学!!!(详细步骤+代码)

    简介 还在因各种情侣节日不知道送对方什么礼物而感到苦恼吗?不如试试这个超浪漫的微信聊天词云! 整体思路主要为: 1. 利用模拟器找到备份文件 2. 解密文件并导出文本文件 3. 代码制作词云 前期准备 ...

  2. python词云库wordcloud自定义词云制作步骤详解

    读书使人充实,讨论使人机智,笔记使人准确-.凡有所学,皆成性格. ---- (英国)培根 文章目录 wordcloud库常规方法 第三方库 读取文件 自定义绘制指定形状的词云 wordcloud库常规 ...

  3. python生成词云_词云制作没那么难,Python 10 行代码就实现了!

    欢迎点击右上角关注小编,除了分享技术文章之外还有很多福利,私信"学习资料"可以领取包括不限于Python实战演练.PDF电子文档.面试集锦.学习资料等. 写在前面 想必大家有一个问 ...

  4. python:2019新年贺词的词云制作以及基于TF-IDF的关键词提取

    本文选取的文本是2019年国家发布的新年贺词,我们将以此制作一个词云图,并使用TF-IDF方法提取其关键词. 2019新年贺词下载 python词云制作 本文所使用的python包为jieba/Wor ...

  5. 词云制作与词性统计——采用爬取的歌曲评论数据

    文章目录 前言 一.评论数据清洗整理 二.词云与词性统计 1.词云制作 2. 词性统计 3. 词云与词性部分的全部代码 三.selenium评论获取部分 总结 前言 python课实验, 将爬取到QQ ...

  6. Python入门(十七):词云制作

    文章目录 词云制作 英文文本 中文文本 jieba库 概述 安装 使用 词云制作 wordcloud库 概述 安装 使用 示例 英文文本:以 hamlet 为例 中文文本:以<三国演义>为 ...

  7. python实验报告实验总结_Python词云制作实验报告

    实验题目:n Python 词云制作实验报告 实验目的与要求: 础 掌握基础 Python 安装过程和词云制作. 实验步骤: n Python 安装 1.击 双击 Anaconda2-4.0.0-Wi ...

  8. 无需编程,一分钟学会词云制作

    文字云起源于美国,在英文互联网中早已有了各类各样的词云网站.然后这些网站对中文的支持都不够友好. 最近发现了一个免费的在线中文词云制作网站,用起来爽歪歪.优词云(www.uciyun.com)是一个支 ...

  9. 词云制作这5款工具就够了

    在很多大型演讲,产品发布会PPT上经常能看到词云的身影,它频繁的出现在这种大型活动中,它的特点是什么呢?第一视觉效果好,一张好看的词云图可以给PPT增添很多色彩,第二表达能力强,它可以过滤掉无用的文本 ...

最新文章

  1. 限量!Alibaba首发“Java成长笔记”,差距不止一点点
  2. 如何处理“已超出域所允许创建计算机账户的最大值”
  3. 在线作图|如何绘制一个好看的堆叠柱状图
  4. dialog监听点击空白关闭_为什么App Store打开一片空白?尝试这样解决
  5. seafile服务端的搭建
  6. 超简单调整Fedora25遇到的字体小问题——字体渲染问题和输入框内容显示不全...
  7. oracle 集群 配置,Oracle集群配置
  8. JavaScript反向shell
  9. 在ubuntu安装使用miniconda
  10. 20150310-删除数组中原有对象
  11. python爬虫难度排行榜_无聊写了一个python爬虫程序,用来爬夕阳试炼场排行榜的...
  12. SAP 生产订单创建修改日期
  13. 【CVPR 2021】搜索网络宽度:BCNet: Searching for Network Width with Bilaterally Coupled Network
  14. Oracle:sqlplus命令行登录方法 as sysdba
  15. python电影网络爬虫代码_Python爬虫——爬取豆瓣电影Top250代码实例
  16. (9)Android之路====Android系统OTA更新
  17. 三大运营商充话费送手机,里面的套路太深
  18. linux i5 i7差别,电脑处理器i5和i7的区别,如何选择?
  19. 串口打印乱码问题处理
  20. TokenInsight 关于 $DYDX 信息梳理及市场预期表现分析汇总

热门文章

  1. Ae:表达式应用基础
  2. 2019.9.19年华为杯数模
  3. 二叉树的遍历及解题思路
  4. Linux培训哪家靠谱?过来人教你如何挑选培训机构
  5. 主成分分析碎石图_R: 主成分分析 ~ PCA(Principal Component Analysis)
  6. Linux配置校时服务器
  7. unity shader中 CG和GLSL之间矩阵存储方式的差异
  8. 软件工程 第一周阅读作业
  9. Python标准模块logging
  10. #include <filename> 和 #include “filename“ 有什么区别?