python分析qq聊天记录汉字频率
import re# -*- coding: utf-8 -*-
with open('C:\\Users\\BIMK\\Desktop\\1.txt','r+',encoding='UTF-8') as f:#读qq聊天记录的导出文件a=f.read()
a=re.sub('(\d{4}-\d{2}-\d{2}.{9})','',a)#删除日期信息
a=re.sub('(\[.{2}\])','',a)#删除表情图片
a=re.sub('(鉏飞祥)','',a)
a=re.sub('(晴天)','',a)#删除昵称
a=re.findall('[\u4e00-\u9fa5]',a)#提取中文
s={}
for i in a:#构建统计字典if i not in s:s[i]=1else:s[i]=s[i]+1
s=sorted(s.items(),key = lambda x:x[1],reverse = True)#排序
st=''
for i in s:st=st+i[0]+' '+str(i[1])+'\n'
with open('C:\\Users\\BIMK\\Desktop\\2.txt','w',encoding='UTF-8') as f:#写文件f.write(st)
python分析qq聊天记录汉字频率相关推荐
- 用Python把QQ聊天记录文件转成WORD并排版
和女票在一起五年了,保留了几年的QQ聊天记录,偶然翻到,感觉很温暖,就想把这些文字做成一本属于我们的书,应该会很有纪念意义.然而qq备份的聊天记录是txt格式,网上找了半天也没有合适的排版工具,上百页 ...
- Python分析QQ群消息
1.安装相关库 wordcloud.imread.scipy等使用pip install命令行安装失败后,可以通过以下网站,查找对应的本地安装包,下载下来,再通过pip install xxx.whl ...
- python分析qq好友_Python2.7获取QQ空间部分好友
首先需要安装curl工具,然后复制curl 参考http://blog..net/gsls200808/article/details/46933307 浏览器打开http://user.qzone. ...
- 把QQ聊天记录插入数据库中
最近在做毕设,其中一个环节是分析qq聊天记录,在分析之前需要先把qq聊天记录导出,然后存入数据库中,qq聊天记录导出后是文本文档,导出方式: 1.登录qq后,点击任意一个好友,查看与他的聊天记录,点击 ...
- 简单的文本挖掘-用于QQ聊天记录(R)
平时的交流很多都在QQ上,QQ交流已经离不开日常的生活,这里我用R来分析QQ聊天记录,看看平时都聊了什么. 首先介绍下用的文本挖掘的包:Rwordseg 一个 R 环境下的中文分词工具,使用 rJa ...
- chatgpt赋能python:Python实现微信聊天记录的方法
Python实现微信聊天记录的方法 随着移动互联网的普及,微信已经成为了人们最为常用的交流工具之一.然而,有时候我们需要将微信聊天记录保存下来,观察和分析聊天数据,寻找有价值的信息.本文将介绍使用Py ...
- python可视化文本分析(1)—分析QQ班群聊天记录宏观
公众号文章链接 前一段时间就想做简单的可视化文本分析玩,今天就花点时间先对整体班级的QQ群聊天信息做一个简单的分析. 打算分两步做,本文是最简单的第一步过程 1:分析整个聊天记录的时间分配.并且用ma ...
- python可视化文本分析(2)—snownlp jieba分析QQ群成员发言情况
公众号文章链接 第二个情感分析,主要通过python实现qq群消息分析,分析群成员发言总次数,群成员情绪对比,单个群成员的发言词云状况以及单个同学的发言情感走势. 用到一下库: re正则,matplo ...
- 【Python】QQ群聊天记录提取
[Python]QQ群聊天记录提取 没想到我的第一篇CSDN竟然是格式化QQ群聊天记录,反正就是要分析一些东西,导出的QQ群聊记录就很不方便,所以进行一下标准化处理,处理好是下面这样的. 下面就直接贴 ...
最新文章
- no BDOC found in SMW01
- jquery autocomplete的使用
- Java成神之路——CGLIB使用
- php cookie防伪造,技术分享:Cookie 防伪造 防修改
- 提示,请选择有效的文件
- thymeleaf之菜单树
- Elastic Job 入门
- vba移动文件_VBA代码如何移动文件,如何复制文件
- 概率论笔记(一)重要公式
- 记java的那些编辑器的故事之凌嘉文+李晓彤-结对编程
- 什么是局域网?什么是广域网?CCNP是什么证书?电信能提供长途数据线路吗?
- 数据时代的来临,大数据价值主要体现在哪几个方面?
- postgresql 不区分大小写 模糊查询
- 图灵学院:淘宝大秒系统设计详解
- Maven_Maven简介
- RHEL7升级内核版本
- mysql double转字符串_MySQL 字符串 转 int/double CAST与CONVERT 函数的用法
- openlayers4 入门开发系列之船讯篇
- java 1m几个字节_1m等于多少kb - 巍巍的个人页面 - OSCHINA - 中文开源技术交流社区...
- hackbar2.1.3免费版本使用教程
热门文章
- 浏览器点击pdf的链接——实现下载或预览功能——基础积累
- Windows Server2003系统安全设置
- OpenCV入门系列1:图像组成与OpenCV基本操作函数
- 字节跳动秋招提前批客户端面试(已oc)
- 小程序tabbar能放分包路径吗_微信小程序底部导航Tabbar
- 对于代码复现学习的一些理解||计算机研究生学习笔记||经验分享||深度学习||pytorch||不定期长期更新
- Matlab/ simulink仿真的直流配电网,图2为下垂控制仿真模型,图3为换流器(VSC)仿真模型
- CCNA考试情况及心得体会
- 拼多多的搜索的参数anti_content怎么破
- 操作系统 - 1. 绪论