qq聊天记录词频查询 python实现
为了给后期聊天机器人提供大量的聊天词汇写了这个脚本,感兴趣的朋友可以看一下
下面是代码:
#-*-coding:utf8-*-
import re
def getWordRate(name,path,requestL):file = open(path,'r')person = 'None'value = FalsePersonNum = len(name)dict = {}for i in range(PersonNum):dict[i] = {}line = file.readline()while line:line = file.readline()line = line.decode('utf-8')value = Falsefor i in range(PersonNum):if re.search(name[i],line)!=None:person = name[i]value = Trueif value == False:for i in range(PersonNum):if person == name[i]:bef = {}if len(line)>requestL-1:for j in range(requestL-1):bef[j] = line[j]for z in range(requestL-1,len(line)):key = ""for j in range(requestL-1):key = key + bef[j]key = key + line[z]if requestL > 2:for j in range(requestL-2):bef[j] = bef[j+1]bef[requestL-2] = line[z]else :if requestL == 2:bef[0] = line[z]if dict[i].has_key(key):dict[i][key] = dict[i][key] + 1else:dict[i][key] = 1return dictprint u'请输入聊天地址的路径'
path = raw_input()
print u'请输入你需要查找的总人数'
num = int(raw_input())
name = {}
print u'请分别输入他们的名字'
for i in range(num):print u'姓名',i+1name[i] = raw_input().decode('utf-8')
while True:print u'请输入你想查询词频的长度'requestL = int(raw_input())print u'请输入你想查询的对象姓名'requestName = raw_input().decode('utf-8')print u'查询中。。。'dict = getWordRate(name,path,requestL)i = 0for key in name:if name[key]==requestName:breaki = i + 1dict[i] = sorted(dict[i].iteritems(),key=lambda d:d[1],reverse=True)for key in dict[i]:print key[0],"------------------->",key[1]print u'打印完毕,如果想继续查询输入yes'if raw_input() != 'yes':break
将qq聊天记录导出到目标文件夹,注意应该导出的格式是txt
path就填这个txt的名字 (如123.txt)
注意 输入人数必须输入所有聊天对象,也是本程序非常不智能的地方,比如是啊a和b的聊天记录,但a之前的昵称叫做c,那么输入人数为3
qq聊天记录词频查询 python实现相关推荐
- python正则将qq聊天记录转换为html
目录 一.需求 二.知识要点 三.全部代码 四.使用方法 五.转换效果 六.参考资料 一.需求 提取qq聊天记录中的所有图片并保存在指定的文件夹,并将聊天记录转换为html. 二.知识要点 大文件的流 ...
- 用Python把QQ聊天记录文件转成WORD并排版
和女票在一起五年了,保留了几年的QQ聊天记录,偶然翻到,感觉很温暖,就想把这些文字做成一本属于我们的书,应该会很有纪念意义.然而qq备份的聊天记录是txt格式,网上找了半天也没有合适的排版工具,上百页 ...
- Python将我与王心凌的QQ聊天记录,生成词云(情人节的后续)
在这个情人节前夕,我把现任对象回收掉了,这段感情积攒了太多的失望,也给了我太多的伤害,所以我看到这个活动的第一反应是拒绝的.然而人生嘛,最重要的就是体验,沉浸在过去的回忆里没有意义,积极面对才能让自己 ...
- python分析qq聊天记录汉字频率
import re# -*- coding: utf-8 -*- with open('C:\\Users\\BIMK\\Desktop\\1.txt','r+',encoding='UTF-8') ...
- pyecharts qq聊天记录数据可视化
数据说明 1.本次数据来源于qq群聊天记录 2.一共3123条数据,可以直接用qq导出聊天记录 3.使用到的库有pyecharts jieba 发言排行 index_id name count 1 闰 ...
- python分析红楼梦出现的虚词词频统计,python对红楼梦的每一章节进行词频统计
python对红楼梦的每一章节进行词频统计 python对红楼梦的每一章节进行词频统计 import jieba f=open("G:\\红楼梦.txt","r" ...
- 简单的文本挖掘-用于QQ聊天记录(R)
平时的交流很多都在QQ上,QQ交流已经离不开日常的生活,这里我用R来分析QQ聊天记录,看看平时都聊了什么. 首先介绍下用的文本挖掘的包:Rwordseg 一个 R 环境下的中文分词工具,使用 rJa ...
- QQ聊天记录如何加密
原文链接:http://www.baiyikeji.com/rjgc/265.htm QQ,就是OICQ,TENCENT公司研发的即时信息软件,是中国市场上国产IM软件绝对的老大.中国网民几乎人手至少 ...
- QQ聊天记录可作交易证据 网上购物有了规范
足不出户,轻点鼠标就能完成一次购物,网上购物已成为杭州市民日常购物方式的一种.面对网络交易如火如荼之势,近期,商务部出台了<关于网上交易的指导意见(暂行)>,提醒网上交易者,网络交易存在一 ...
最新文章
- Gut:人体最初的微生物起源与生殖健康
- signature=066eaf4ada3cc7a99cb8d41fb298a3d4,Video Fusion Display Systems
- JavaScript中 for、for in、for of、forEach等使用总结
- 检查mysql当前状态
- Java并发编程 Synchronized及其实现原理
- 一口气说出 4 种分布式一致性 Session 实现方式,面试杠杠的~
- 超不清视频播放器-用Python将视频转成字符
- 威联通nas怎么更换大硬盘_QNAP NAS在线RAID组态迁移及在线RAID容量扩充教程
- VTK:平行坐标用法实战
- P3225-[HNOI2012]矿场搭建【tarjan,图论】
- JOOQ事实:从JPA批注到JOOQ表映射
- 【一类题】二维数点的几个做法
- 系统时钟(汇编语言程序设计)
- 电脑访问不了虚拟机ftp服务器,解决win环境下访问本机虚拟机中centos7 ftp服务器的问题...
- springboot 微服务_Spring Boot在微服务中的最佳实践
- 如何使用计算机小学生课件,小学信息技术计算机基础ppt课件
- 现金支票打印模板excel_施工表格填写不规范?500套最全施工资料表格模板,可直接套用|面层|分项...
- xlsx表格怎么筛选重复数据_excel表格中如何筛选重复数据
- [教程]BaiduPCS-Go
- 用Python在喜马拉雅音乐爬虫小试
热门文章
- vue里面nprogress的使用
- 一年级上册生字组词测试可打印去哪里打印
- MongoDB技术实践与应用案例征集活动
- error: ‘PoseStamped’ in namespace ‘geometry_msgs’ does not name a type
- Centos7 虚拟机非法关机导致系统无法启动报Unmount and run xfs_repair的解决方法
- Re-ID综述(持续)
- 使用插件ajaxfileupload通过ajax方式上传文件,在火狐下出错
- Revit中元素重要的属性和方法
- 关于unity区域截图像素越界解决办法
- Python pip更换国内镜像