一般我们从网上下下来的数据都很杂乱的,什么样的情况都有,不利于我们整理,所以在拿到数据的时候我们会先做一遍数据清理,把垃圾数据清理掉。

今天我们拿QQ数据做示范。

我们命令行是怎么看数据!

[Asm] 纯文本查看 复制代码more zy.txt

#然后空格进行翻页

效果如图:

1.png (11.5 KB, 下载次数: 0)

2018-1-30 17:54 上传

从数据中得知:

---- 中间4个-

左边是账号,右边是密码

目前QQ最多就11位,密码最长16位,所以数据中位数最多31位(4+11+16),大于的都是垃圾(第一轮筛选)

我先用python 读取QQ操作

[Asm] 纯文本查看 复制代码import codecs

filepath=r"C:\Users\Administrator\Desktop\zy.txt"

file=codecs.open(filepath,"rb","gbk","ignore")#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

#savefilepath="C:\Users\Administrator\Desktop\zy1.txt"

for line in mylist:

QQlist=line.split('----')

print(QQlist[1])

2.png (19.57 KB, 下载次数: 1)

2018-1-30 17:55 上传

注:此方法是读取到内存,所以很占空间,会很卡。

数据中我们看到很多垃圾数据,我们看下垃圾数据

[Asm] 纯文本查看 复制代码import codecs

filepath=r"C:\Users\Administrator\Desktop\zy.txt"

file=codecs.open(filepath,"rb","gbk","ignore")#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

#savefilepath="C:\Users\Administrator\Desktop\zy1.txt"

for line in mylist:

QQlist=line.split('----')

if len(line)>31:

print(line)#打印垃圾数据

22.png (26 KB, 下载次数: 0)

2018-1-30 17:56 上传

进行QQ清洗,在分别保存账号文本和密码文本。

[Asm] 纯文本查看 复制代码import codecs

filepath=r"C:\Users\Administrator\Desktop\zy.txt"

file=codecs.open(filepath,"rb","gbk","ignore")#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

savegoodfilepath=r"C:\Users\Administrator\Desktop\zyQQGood.txt"

savebadfilepath=r"C:\Users\Administrator\Desktop\zyQQbad.txt"

filegood=open(savegoodfilepath,"wb")

filebad=open(savebadfilepath,"wb")

for line in mylist:

if len(line)>31 or len(line)<=15:#(4+5+6)

filebad.write(line.encode("utf-8"))

else:

QQlist = line.split('----')

if len(QQlist)==2:

filegood.write(line.encode("utf-8"))

else:

filebad.write(line.encode("utf-8"))

filebad.close()

filegood.close()

效果图:

44.png (38.09 KB, 下载次数: 0)

2018-1-30 17:57 上传

附件:

中央纪委pyhon数据清理.zip

(3.81 KB, 下载次数: 25)

2018-1-30 17:58 上传

点击文件名下载附件

下载积分: 吾爱币 -1 CB

python破解qq密码_央·python编程之QQ数据清洗相关推荐

  1. 学习python下载哪个版本_听学编程之Python 一、Python版本和安装

    本文应听友要求,根据喜马拉雅上的音频节目『听学编程之Python』整理所得. python是好是坏,我就不多啰嗦了,既然你收听了这个教程,那就说明你要学这个语言了.基本不会亏的.这个语言很有用,完全可 ...

  2. python如何隐藏密码_在python脚本中隐藏密码(仅限不安全的混淆)

    Base64编码是在标准库中,并将停止肩膀冲浪者: >>> import base64 >>> print base64.b64encode("passw ...

  3. python设置默认密码_使用Python生成随机密码的示例分享

    生成随机密码这件事情用python来干确实相当的方便,优美的string方法加上choice简直是绝配 make_password.py ###简单几行代码执行即可生成记不住的字符串### $ pyt ...

  4. python破解微信黑名单_用Python来检测微信好友是否拉黑你|简明python教程|python入门|python教程...

    https://www.xin3721.com/eschool/pythonxin3721/ 来自知乎,作者:林萌 链接:https://www.zhihu.com/question/30791434 ...

  5. python入门教程NO.3 用python破解谍报密码

    python入门教程NO.3 用python破解谍报密码 本文涉及的python基础语法为:列表及其方法 列表 我们发现了一段存在**[]中的谍报密码,为了破解他,我们必须先来学习一下,这个存放着谍报 ...

  6. Python破解Wifi密码脚本

    Python破解Wifi密码脚本 使用pywifi 暴力破解wifi密码,就是使用使用多个密码与wifi进行连接测试.总的来说,破解成功的可能性是存在的,但需要付出很多的努力,当然,付出努力也不一定能 ...

  7. 计算机考试qq用户找回密码,找回QQ密码_详细讲述QQ密码找回教程方法【图文】-太平洋电脑网PConline-太平洋电脑网...

    QQ号码对于现在大多数人来说就如我们的手机号码一样重要,而QQ密码是QQ的重要保障.QQ密码忘记后,找回QQ密码就必不可少,那么QQ密码怎么找回?怎么快速找回呢?下面我就分享下QQ密码找回的几种高几率 ...

  8. QQ密码忘记怎么办 教你找回QQ密码

    QQ密码找回的重要关键词 QQ密码保护 QQ密码保护是一套保障QQ密码安全的机制.通过给你的QQ号填写对应的相关资料,如证件号.安全提示问题.安全邮箱等,给你的QQ号穿一件防弹衣.一旦出现问题,就可以 ...

  9. 思路+源码,利用Python破解WIFI密码详解,100M的字典已备好

    前言 WIFI破解,Python程序员必学技能.WIFI已经完全普及,现在Python程序员没网,走到哪里都不怕! 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语法过后 ...

最新文章

  1. android 有效载荷大图,避OOM
  2. 将字典结果写入excel
  3. 关于ark取得进程的镜像文件路径
  4. 操作系统之文件管理:7、文件共享与文件保护(软连接、硬链接、口令保护、加密保护、访问控制)
  5. 重读读书笔记的重要性
  6. 性能提升 3 倍的树莓派 4,被爆设计缺陷!
  7. 计算机图形学规则形体,计算机图形学教案
  8. POJ1088(dp)
  9. Linux系统中使用netcat命令的奇技淫巧
  10. 永远不要低估自己,love your fear.
  11. spark 动态预加载数据_Spark+TDengine 在中国电信电力测功系统监控平台上的应用实践...
  12. linux车机carplay模块,卸甲科技UI2.0版本Linux车机发布
  13. 不是技术牛人,如何拿到国内IT巨头的Offer(未整理版本)
  14. 从0到1教你画原型图
  15. 解决beyond compare秘钥被吊销的问题
  16. 计算机网络——wireshark抓包
  17. sudo apt-get update 时遇签名过期错误 “The following signatures were invalid”
  18. OpenEuler树莓派基础实验 20212802范辰宇
  19. 第三十五天:XSS跨站反射存储DOM盲打劫持
  20. ARM指令寻址方式及RealView MDK开发环境ARM汇编程序实践

热门文章

  1. 深天马A第一季度净利润为2.89亿元 同比减少35.4%
  2. 图数据库(八):Neo4j中Cypher语言with关键字
  3. MySQL多表查询练习
  4. 中国下一代互联网(CNGI)建设市场投资前景预测与发展战略规划研究报告2021~2027年
  5. 无法运行Hi3516CV-DEMB-uboot-DDR...-BUS_266M.xsl宏。可能是因为该宏在此工作簿中不可用,或者所有的宏都被禁用。
  6. HiMobileCam SDK安装使用说明(Hi3559V200)(海思)
  7. 7.Unity中c#代码学习(物理系统刚体+碰撞检测(爆炸效果实现))
  8. python中 什么意思_Python里面的这几个梗,你能回答出来吗
  9. 蓝桥杯(python)——机器人数目
  10. 随机森林-sklearn