为了给后期聊天机器人提供大量的聊天词汇写了这个脚本,感兴趣的朋友可以看一下

下面是代码:

#-*-coding:utf8-*-
import re
def getWordRate(name,path,requestL):file = open(path,'r')person = 'None'value = FalsePersonNum = len(name)dict = {}for i in range(PersonNum):dict[i] = {}line = file.readline()while line:line = file.readline()line = line.decode('utf-8')value = Falsefor i in range(PersonNum):if re.search(name[i],line)!=None:person = name[i]value = Trueif value == False:for i in range(PersonNum):if person == name[i]:bef = {}if len(line)>requestL-1:for j in range(requestL-1):bef[j] = line[j]for z in range(requestL-1,len(line)):key = ""for j in range(requestL-1):key = key + bef[j]key = key + line[z]if requestL > 2:for j in range(requestL-2):bef[j] = bef[j+1]bef[requestL-2] = line[z]else :if requestL == 2:bef[0] = line[z]if dict[i].has_key(key):dict[i][key] = dict[i][key] + 1else:dict[i][key] =  1return dictprint u'请输入聊天地址的路径'
path = raw_input()
print u'请输入你需要查找的总人数'
num = int(raw_input())
name = {}
print u'请分别输入他们的名字'
for i in range(num):print u'姓名',i+1name[i] = raw_input().decode('utf-8')
while True:print u'请输入你想查询词频的长度'requestL = int(raw_input())print u'请输入你想查询的对象姓名'requestName = raw_input().decode('utf-8')print u'查询中。。。'dict = getWordRate(name,path,requestL)i = 0for key in name:if name[key]==requestName:breaki = i + 1dict[i] = sorted(dict[i].iteritems(),key=lambda d:d[1],reverse=True)for key in dict[i]:print key[0],"------------------->",key[1]print u'打印完毕,如果想继续查询输入yes'if raw_input() != 'yes':break

将qq聊天记录导出到目标文件夹,注意应该导出的格式是txt

path就填这个txt的名字 (如123.txt)

注意 输入人数必须输入所有聊天对象,也是本程序非常不智能的地方,比如是啊a和b的聊天记录,但a之前的昵称叫做c,那么输入人数为3

qq聊天记录词频查询 python实现相关推荐

  1. python正则将qq聊天记录转换为html

    目录 一.需求 二.知识要点 三.全部代码 四.使用方法 五.转换效果 六.参考资料 一.需求 提取qq聊天记录中的所有图片并保存在指定的文件夹,并将聊天记录转换为html. 二.知识要点 大文件的流 ...

  2. 用Python把QQ聊天记录文件转成WORD并排版

    和女票在一起五年了,保留了几年的QQ聊天记录,偶然翻到,感觉很温暖,就想把这些文字做成一本属于我们的书,应该会很有纪念意义.然而qq备份的聊天记录是txt格式,网上找了半天也没有合适的排版工具,上百页 ...

  3. Python将我与王心凌的QQ聊天记录,生成词云(情人节的后续)

    在这个情人节前夕,我把现任对象回收掉了,这段感情积攒了太多的失望,也给了我太多的伤害,所以我看到这个活动的第一反应是拒绝的.然而人生嘛,最重要的就是体验,沉浸在过去的回忆里没有意义,积极面对才能让自己 ...

  4. python分析qq聊天记录汉字频率

    import re# -*- coding: utf-8 -*- with open('C:\\Users\\BIMK\\Desktop\\1.txt','r+',encoding='UTF-8') ...

  5. pyecharts qq聊天记录数据可视化

    数据说明 1.本次数据来源于qq群聊天记录 2.一共3123条数据,可以直接用qq导出聊天记录 3.使用到的库有pyecharts jieba 发言排行 index_id name count 1 闰 ...

  6. python分析红楼梦出现的虚词词频统计,python对红楼梦的每一章节进行词频统计

    python对红楼梦的每一章节进行词频统计 python对红楼梦的每一章节进行词频统计 import jieba f=open("G:\\红楼梦.txt","r" ...

  7. 简单的文本挖掘-用于QQ聊天记录(R)

    平时的交流很多都在QQ上,QQ交流已经离不开日常的生活,这里我用R来分析QQ聊天记录,看看平时都聊了什么. 首先介绍下用的文本挖掘的包:Rwordseg  一个 R 环境下的中文分词工具,使用 rJa ...

  8. QQ聊天记录如何加密

    原文链接:http://www.baiyikeji.com/rjgc/265.htm QQ,就是OICQ,TENCENT公司研发的即时信息软件,是中国市场上国产IM软件绝对的老大.中国网民几乎人手至少 ...

  9. QQ聊天记录可作交易证据 网上购物有了规范

    足不出户,轻点鼠标就能完成一次购物,网上购物已成为杭州市民日常购物方式的一种.面对网络交易如火如荼之势,近期,商务部出台了<关于网上交易的指导意见(暂行)>,提醒网上交易者,网络交易存在一 ...

最新文章

  1. Gut:人体最初的微生物起源与生殖健康
  2. signature=066eaf4ada3cc7a99cb8d41fb298a3d4,Video Fusion Display Systems
  3. JavaScript中 for、for in、for of、forEach等使用总结
  4. 检查mysql当前状态
  5. Java并发编程 Synchronized及其实现原理
  6. 一口气说出 4 种分布式一致性 Session 实现方式,面试杠杠的~
  7. 超不清视频播放器-用Python将视频转成字符
  8. 威联通nas怎么更换大硬盘_QNAP NAS在线RAID组态迁移及在线RAID容量扩充教程
  9. VTK:平行坐标用法实战
  10. P3225-[HNOI2012]矿场搭建【tarjan,图论】
  11. JOOQ事实:从JPA批注到JOOQ表映射
  12. 【一类题】二维数点的几个做法
  13. 系统时钟(汇编语言程序设计)
  14. 电脑访问不了虚拟机ftp服务器,解决win环境下访问本机虚拟机中centos7 ftp服务器的问题...
  15. springboot 微服务_Spring Boot在微服务中的最佳实践
  16. 如何使用计算机小学生课件,小学信息技术计算机基础ppt课件
  17. 现金支票打印模板excel_施工表格填写不规范?500套最全施工资料表格模板,可直接套用|面层|分项...
  18. xlsx表格怎么筛选重复数据_excel表格中如何筛选重复数据
  19. [教程]BaiduPCS-Go
  20. 用Python在喜马拉雅音乐爬虫小试

热门文章

  1. vue里面nprogress的使用
  2. 一年级上册生字组词测试可打印去哪里打印
  3. MongoDB技术实践与应用案例征集活动
  4. error: ‘PoseStamped’ in namespace ‘geometry_msgs’ does not name a type
  5. Centos7 虚拟机非法关机导致系统无法启动报Unmount and run xfs_repair的解决方法
  6. Re-ID综述(持续)
  7. 使用插件ajaxfileupload通过ajax方式上传文件,在火狐下出错
  8. Revit中元素重要的属性和方法
  9. 关于unity区域截图像素越界解决办法
  10. Python pip更换国内镜像