一、导出QQ消息记录


然后选择[导出全部消息记录]

这里注意要将保存类型改为txt文件

二、函数处理

import re
import wordcloud
from PIL import Image
import numpy as np
import jiebadef delSysDateName(msgLine):"""定义聊天文件处理函数:使用正则去除聊天文件中的日期、昵称等系统信息"""# re.sub(pattern, repl, string, count=0, flags=0)# 参数1:需要被匹配到的模板             pattern# 参数2:根据第1个参数条件替换进去的内容replace# 参数3:传入要被替换处理的字符串       string# 如果匹配到了日期信息,这一行都不要了if None != re.search("^\d{4}-\d{2}-\d{2} \d{1,2}:\d{1,2}:\d{1,2}", msgLine)\or ('参加了投票' in msgLine) \or ('自动回复' in msgLine)\or ('申请加入' in msgLine)\or ('撤回' in msgLine)\or (r'[QQ红包]' in msgLine)\or ('我现在有事不在' in msgLine)\or (r'对方已' in msgLine):return ""# 否则就进行下一步处理else:return delUselessInfo(msgLine)def delUselessInfo(msgLine):"""使用正则去掉@信息替换掉txt中无法显示的图片和表情"""# print("有用的信息msgLine:{}".format(msgLine))msgLine = re.sub(r'\'*', "", msgLine)return re.sub(r'@.* ', "", msgLine).replace(r"[图片]", "").replace(r"[表情]", "").strip()if __name__ == '__main__':#  用作mask的imageimage = np.array(Image.open("pikaqiu.png")) # 你自己找一个颜色界限分明的图片,如五角星、红色中国地图等都行with open(r"全部消息记录.txt", "r", encoding="utf8") as file:msg = file.read()# 将读入的txt按行分开,对每行进行处理,并过滤掉投票和红包信息。lines = msg.strip().split("\n")cleanedLines = []for line in lines:replacedStr = delSysDateName(line)if replacedStr != "":cleanedLines.append(replacedStr)usefulMsg = str(cleanedLines)# print("usefulMsg:{}".format(usefulMsg))stopWords = ['请使用手机QQ查看', '最近联系人\'','全体成员\'' '群签到', '消息分组', '滑呀滑\'','请使用新版手机QQ查看', '请使用最新版手机QQ查看', r'xa0', '多处登录上线通知\'', '多处登录下线通知\'']w = wordcloud.WordCloud(font_path="C:\Windows\Fonts\STKAITI.TTF", background_color="white", mask=image, stopwords=stopWords)w.generate("".join(jieba.lcut(usefulMsg)))w.to_file("msg_cloud.png")

python使用worldcloud模块、jieba模块做QQ消息记录词云相关推荐

  1. python jieba库分词_Python基于jieba库进行简单分词及词云功能实现方法

    本文实例讲述了Python基于jieba库进行简单分词及词云功能实现方法.分享给大家供大家参考,具体如下: 目标: 1.导入一个文本文件 2.使用jieba对文本进行分词 3.使用wordcloud包 ...

  2. python用数据告诉你谁是《西游记》真正的主角:基于jieba模块的分析与基于pyechart的词云可视化展示

    先说结论:西游记里面孙悟空(孙行者)的出镜率最高,是名副其实的男猪脚.以下的词云图可以直观地证明这个结论.那么这个图是怎么的出来的呢?本文将分七个步骤进行详细的说明. 一.导入所需模块 这个任务我们需 ...

  3. python课程设计,学了python后你可以做的案例(词云,折线图,饼图…)

    目录 第一章 任务描述 1.1背景和意义 1.1.1背景: 1.2目标 第二章python开发环境的构建 2.1准备工作 2.1.1所需软件 第三章 用到的网络知识 第四章 源码 第一章 任务描述   ...

  4. Python + wordcloud + jieba 十分钟学会生成中文词云

    前述 本文需要的两个Python类库 jieba:中文分词分词工具 wordcloud:Python下的词云生成工具 写作本篇文章用时一个小时半,阅读需要十分钟,读完该文章后你将学会如何将任意中文文本 ...

  5. 利用Python做一个小姐姐词云跳舞视频

    点击上方蓝色小字,关注"涛哥聊Python" 重磅干货,第一时间送达 来源:修炼Python 每周三个人直播,想和我聊天的欢迎来约 ‍‍‍‍‍‍‍朝朝暮暮里,祝愿我们每个人都能沉淀 ...

  6. 揭秘新推广渠道::利用腾讯文档做QQ消息弹窗

    圈内营销大佬推广又搞出了新路子,利用腾讯文档做QQ微信消息弹窗推广,折腾出了一种新的推广方式! 在之前,很多站长估计之前都没有仔细观察注腾讯文档这个产品,都是用来在线编辑文档办公用,很多人没想到是,最 ...

  7. Python提取岛上书店书中所有书名后做成词云

    通过笔者Python提取<岛上书店>书名这一文章内容中的算法二,我们成功地把<岛上书店>中所有书名提取出来,并保存到同目录下的output.txt文件中.如果单单将这个发到朋友 ...

  8. Python 爬取B站视频信息 弹幕信息 生成词云统计

    本文介绍功能:实现爬取B站视频信息(用户输入关键词).爬取弹幕信息(支持自定义天数).生成词云图 完整代码地址:https://github.com/736755244/py_bilibili 一.数 ...

  9. 【零基础学Python】爬虫篇 :第十四节--爬虫+词云解决实际问题

    十行代码帮助小姐姐给偶像送上最真挚的礼物----爬虫词云齐上阵,熬夜精心制作 905.png#pic_center) 故事背景 最近嘛,有位朋友找我帮忙嘛,希望我帮她做一份礼物,送给一直鼓舞着她不断向 ...

最新文章

  1. python 搭建的http 动态服务器_Python 创建HTTP服务器的简单示例
  2. web前端 vue、react、angular三大框架对比 与jquery的对比
  3. python类方法中使用:修饰符@staticmethod和@classmethod的作用与区别,还有装饰器@property的使用
  4. 握手失败_拜托了,看完这篇别再问我什么是TCP三次握手和四次挥手
  5. mysql脚本模式创建索引_mysql创建脚本索引范例
  6. Python 内置模块之 os
  7. gerrit配置replication插件
  8. HTTP协议详解 (转)
  9. 机器学习、数据分析类面经分享
  10. linux vi ^M符号
  11. 279. 完全平方数
  12. Sql Server卸载安装
  13. eclipse插件开发:把自定义的文件类型使用xml编辑器打开
  14. 力扣数据库(end09.02)
  15. 基于帕累托的多目标遗传算法优化的原理与 Python 实现
  16. 多线程调用ch.ethz.ssh2.Connection执行shell任务时有的执行丢失情况解决
  17. 运用python进行海龟交易法回测
  18. 「镁客早报」NASA公布“门户计划”,未来将在月球轨道建立空间站;特斯拉裁掉Model3交付部门一半以上...
  19. PCIe——LTSSM
  20. 63页智慧工业园区大数据云平台建设和运营解决方案

热门文章

  1. insert...on duplicate key update语法详解
  2. too many open files in system报错处理方案
  3. 北邮硕士、前百度工程师:能进大厂,就不用读研究生了!
  4. Maestro Z实时无标记细胞分析仪,评估免疫细胞治疗效价
  5. 计算机科技兴趣小组活动总结,科技兴趣小组的活动总结
  6. 机器学习流程是什么?简述机器学习流程!
  7. 【WebFace260M】《WebFace260M:A Benchmark Unveiling the Power of Million-Scale Deep Face Recognition》
  8. 字节跳动面经(2020春招)
  9. 怎样更换手机壁纸?2022更换手机壁纸软件大全
  10. 人工智能的发展对生活有什么影响?