import re# -*- coding: utf-8 -*-
with open('C:\\Users\\BIMK\\Desktop\\1.txt','r+',encoding='UTF-8') as f:#读qq聊天记录的导出文件a=f.read()
a=re.sub('(\d{4}-\d{2}-\d{2}.{9})','',a)#删除日期信息
a=re.sub('(\[.{2}\])','',a)#删除表情图片
a=re.sub('(鉏飞祥)','',a)
a=re.sub('(晴天)','',a)#删除昵称
a=re.findall('[\u4e00-\u9fa5]',a)#提取中文
s={}
for i in a:#构建统计字典if i not in s:s[i]=1else:s[i]=s[i]+1
s=sorted(s.items(),key = lambda x:x[1],reverse = True)#排序
st=''
for i in s:st=st+i[0]+' '+str(i[1])+'\n'
with open('C:\\Users\\BIMK\\Desktop\\2.txt','w',encoding='UTF-8') as f:#写文件f.write(st)

python分析qq聊天记录汉字频率相关推荐

  1. 用Python把QQ聊天记录文件转成WORD并排版

    和女票在一起五年了,保留了几年的QQ聊天记录,偶然翻到,感觉很温暖,就想把这些文字做成一本属于我们的书,应该会很有纪念意义.然而qq备份的聊天记录是txt格式,网上找了半天也没有合适的排版工具,上百页 ...

  2. Python分析QQ群消息

    1.安装相关库 wordcloud.imread.scipy等使用pip install命令行安装失败后,可以通过以下网站,查找对应的本地安装包,下载下来,再通过pip install xxx.whl ...

  3. python分析qq好友_Python2.7获取QQ空间部分好友

    首先需要安装curl工具,然后复制curl 参考http://blog..net/gsls200808/article/details/46933307 浏览器打开http://user.qzone. ...

  4. 把QQ聊天记录插入数据库中

    最近在做毕设,其中一个环节是分析qq聊天记录,在分析之前需要先把qq聊天记录导出,然后存入数据库中,qq聊天记录导出后是文本文档,导出方式: 1.登录qq后,点击任意一个好友,查看与他的聊天记录,点击 ...

  5. 简单的文本挖掘-用于QQ聊天记录(R)

    平时的交流很多都在QQ上,QQ交流已经离不开日常的生活,这里我用R来分析QQ聊天记录,看看平时都聊了什么. 首先介绍下用的文本挖掘的包:Rwordseg  一个 R 环境下的中文分词工具,使用 rJa ...

  6. chatgpt赋能python:Python实现微信聊天记录的方法

    Python实现微信聊天记录的方法 随着移动互联网的普及,微信已经成为了人们最为常用的交流工具之一.然而,有时候我们需要将微信聊天记录保存下来,观察和分析聊天数据,寻找有价值的信息.本文将介绍使用Py ...

  7. python可视化文本分析(1)—分析QQ班群聊天记录宏观

    公众号文章链接 前一段时间就想做简单的可视化文本分析玩,今天就花点时间先对整体班级的QQ群聊天信息做一个简单的分析. 打算分两步做,本文是最简单的第一步过程 1:分析整个聊天记录的时间分配.并且用ma ...

  8. python可视化文本分析(2)—snownlp jieba分析QQ群成员发言情况

    公众号文章链接 第二个情感分析,主要通过python实现qq群消息分析,分析群成员发言总次数,群成员情绪对比,单个群成员的发言词云状况以及单个同学的发言情感走势. 用到一下库: re正则,matplo ...

  9. 【Python】QQ群聊天记录提取

    [Python]QQ群聊天记录提取 没想到我的第一篇CSDN竟然是格式化QQ群聊天记录,反正就是要分析一些东西,导出的QQ群聊记录就很不方便,所以进行一下标准化处理,处理好是下面这样的. 下面就直接贴 ...

最新文章

  1. no BDOC found in SMW01
  2. jquery autocomplete的使用
  3. Java成神之路——CGLIB使用
  4. php cookie防伪造,技术分享:Cookie 防伪造 防修改
  5. 提示,请选择有效的文件
  6. thymeleaf之菜单树
  7. Elastic Job 入门
  8. vba移动文件_VBA代码如何移动文件,如何复制文件
  9. 概率论笔记(一)重要公式
  10. 记java的那些编辑器的故事之凌嘉文+李晓彤-结对编程
  11. 什么是局域网?什么是广域网?CCNP是什么证书?电信能提供长途数据线路吗?
  12. 数据时代的来临,大数据价值主要体现在哪几个方面?
  13. postgresql 不区分大小写 模糊查询
  14. 图灵学院:淘宝大秒系统设计详解
  15. Maven_Maven简介
  16. RHEL7升级内核版本
  17. mysql double转字符串_MySQL 字符串 转 int/double CAST与CONVERT 函数的用法
  18. openlayers4 入门开发系列之船讯篇
  19. java 1m几个字节_1m等于多少kb - 巍巍的个人页面 - OSCHINA - 中文开源技术交流社区...
  20. hackbar2.1.3免费版本使用教程

热门文章

  1. 浏览器点击pdf的链接——实现下载或预览功能——基础积累
  2. Windows Server2003系统安全设置
  3. OpenCV入门系列1:图像组成与OpenCV基本操作函数
  4. 字节跳动秋招提前批客户端面试(已oc)
  5. 小程序tabbar能放分包路径吗_微信小程序底部导航Tabbar
  6. 对于代码复现学习的一些理解||计算机研究生学习笔记||经验分享||深度学习||pytorch||不定期长期更新
  7. Matlab/ simulink仿真的直流配电网,图2为下垂控制仿真模型,图3为换流器(VSC)仿真模型
  8. CCNA考试情况及心得体会
  9. 拼多多的搜索的参数anti_content怎么破
  10. 操作系统 - 1. 绪论