Scavenger是一款可在多个paste网站上搜索泄漏的凭据的工具。

Scavenger – OSINT Bot
自动化Snyk依赖以下扫描结果:

已知漏洞

处于活动中的bot

介绍
我的OSInt bot会在不同paste网站上搜索敏感数据泄漏。

当前支持搜索的内容如下:

用户凭据

RSA私钥

WordPress配置文件

MySQL连接字符串

Onion链接

托管在Onion网络内的文件链接(PDF、DOC、DOCX、XLS、XLSX)

这里我需要提前向大家说明下:

这个bot并不完美,而且也存在很多缺陷。我当时在编写它时只花了很短的时间,代码很粗造…我想说我从来不关心这些问题。

到目前为止,代码还未完成。该在线存储库中也并不完整,例如没有在数据库中集成凭据。

如果你想使用此代码,那么请随意。但你必须自定义一些内容,以让其在你的系统上可以正常运行。

另外,它可能会存在一些误报的情况,并因此会错过一些可能对你而言非常重要的凭据。所以,如果你有更好的检测想法,那么请随时告诉我!

关于 Scavenger 的文章
https://jakecreps.com/2019/05/08/osint-collection-tools-for-pastebin/

https://jakecreps.com/2019/01/08/scavenger/

重要
bot可以在两种主要模式下运行:

API模式

爬取模式(使用TOR)

我强烈建议你使用API模式。这对于从Pastebin.com爬取pastes非常好用。你唯一需要的就是一个Pastebin.com PRO帐户,并在其网站上将你的公共IP添加到白名单中。

想要以API模式启动bot,只需按以下方式运行即可:

python run.py -0

但是,并不总是可以使用这种模式,在有些情况下例如你可能处于NAT模式,因此你没有专门的IP(将IP添加到白名单在这里是不合理的)。这也是为什么我实现了另一种爬取模式的原因。在这种模式下,快速的Tor循环与合理的用户代理结合使用,可避免IP锁定和Cloudflare验证码。

想要以爬取模式启动bot,只需按以下方式运行即可:

python run.py -1

重要说明:你需要在系统上安装TOR服务,侦听端口9050。此外,你还需要将以下行添加到/etc/tor/torrc文件中。

MaxCircuitDirtiness 30
这会将TOR的最大循环时间设置为30秒。

使用
想要了解有关该工具的更多使用信息,运行以下命令即可:

python run.py -h
输出内容如下:_________/   _____/ ____ _____ ___  __ ____   ____    ____   ___________\_____  \_/ ___\\__  \\  \/ // __ \ /    \  / ___\_/ __ \_  __ \/        \  \___ / __ \\   /\  ___/|   |  \/ /_/  >  ___/|  | \/
/_______  /\___  >____  /\_/  \___  >___|  /\___  / \___  >__|\/     \/     \/          \/     \//_____/      \/usage: run.py [-h] [-0] [-1] [-2] [-ps]Control software for the different modules of this paste crawler.optional arguments:-h, --help            show this help message and exit-0, --pastebinCOMapi  Activate Pastebin.com module (using API)-1, --pastebinCOMtor  Activate Pastebin.com module (standard scraping usingTOR to avoid IP blocking)-2, --pasteORG        Activate Paste.org module-ps, --pStatistic     Show a simple statistic.

到目前为止,我只实现了Pastebin.com模块,我正在使用Paste.org。未来我将添加更多模块并更新此脚本。

启动Pastebin.com模块(我实现的第一个模块):

python P_bot.py

Pastes被存储到了data/raw_pastes中,直到它们的数量超过了48000。当它们超过这个数时,它们就会被过滤、压缩并移动到归档文件夹中。包含凭据的所有Pastes都会被存储在data/files_with_passwords中。

记住,目前只能检测到USERNAME:PASSWORD以及一些简单的组合。但是,有一个工具可以帮助你搜索包含凭据的代理日志。

你可以使用getProxyLogs.py文件搜索代理日志(包含用户名和密码组合的URL)

python getProxyLogs.py data/raw_pastes
如果要在原始数据中搜索某些特定字符串,可以使用searchRaw.py(速度较慢)来完成。

python searchRaw.py SEARCHSTRING
查看bot的统计信息:

python status.py

文件findSensitiveData.py在文件夹(使用pastes)中搜索敏感数据,如信用卡,RSA密钥或mysqli_connect字符串。记住,此脚本使用grep,因此如果paste文件较大的话速度将非常的慢。如果你想分析大型的pastes文件,我建议你使用ELK-Stack。

python findSensitiveData.py data/raw_pastes
stalk_user.py/stalk_user_wrapper.py有两个脚本,可用于监视特定的Twitter用户。这意味着他发布的每条推文都会被保存,并且每个包含的URL都会被下载。 执行以下命令,启动监控:

python stalk_user_wrapper.py

http://www.45zq.cn/portal/article/index/id/186.html

在不同的paste网站上搜索泄漏的凭据Scavenger相关推荐

  1. Scavenger:在不同的paste网站上搜索泄漏的凭据

    Scavenger是一款可在多个paste网站上搜索泄漏的凭据的工具. Scavenger – OSINT Bot 自动化Snyk依赖以下扫描结果: 已知漏洞 处于活动中的bot 介绍 我的OSInt ...

  2. 网站搜索功能怎么实现_电商网站上的搜索功能是如何实现的?

    今天是刘小爱自学Java的第159天. 感谢你的观看,谢谢你. 学习计划安排如下: 索引库本质上和数据库类似,也是存储数据的,既然如此自然也会有增删改查. 那么这个索引库到底有何特别应用呢? 索引库的 ...

  3. STM32 Tips:如何从ST官方网站上下载STM32标准外设库(STM32F10x standard peripheral library)

    入手了一块STM32F107VCT6开发板,配置开发环境时需要一个库:STM32F10x标准外设库(STM32F10x standard peripheral library),在网上看到很多初学者和 ...

  4. [Python爬虫实战2]爬取济南安居客网站上所需街区的二手房平均房价数据

    文章目录 一.项目简介 二.安居客网页分析 1.整体分析 2.细节分析 2.1提取一个页面所有的房源信息 2.2提取每个房源信息中的信息 2.3如何爬取下一页的房源信息 三.程序编写 1.数据去重 2 ...

  5. 你真的会高效的在GitHub上搜索开源项目吗?

    来源:Tomcat那些事 号外:最近整理了一下以前编写的一系列Spring Boot内容,整了个<Spring Boot基础教程>的PDF,关注我,回复:001,快来领取吧-!更多内容持续 ...

  6. 你社交网站上的照片,也许已经被用来训练人工智能了

    来源:网易智能 斯特于2013年拍摄的这张照片被收录在IBM的人像数据集(Diversity in Faces)中 毫无疑问,这张家庭照片是非常可爱的:照片中的爸爸留着短须,戴着无框眼镜,棕色头发的妈 ...

  7. 优化了破网站的搜索功能

    使用 ES + 云开发实战优化网站搜索 大家好,我是鱼皮,今天搞一场技术实战,需求分析 => 技术选型 => 设计实现,从 0 到 1,带大家优化网站搜索的灵活性. ES + 云开发搜索优 ...

  8. node 后台文章编辑器_我如何使用Node从报纸网站上刮掉7000篇文章

    node 后台文章编辑器 我为什么要这样做? (Why did I do this?) My girlfriend is writing a paper about the perception of ...

  9. 免费人脸识别工具可以跟踪社交媒体网站上的人

    2019独角兽企业重金招聘Python工程师标准>>> 2018年8月9日,斯瓦蒂·汗德瓦尔(Swati Khandelwal 原文地址:https://thehackernews. ...

最新文章

  1. centos 7 部署k8s集群
  2. Java基础班学习笔记(13)IO流
  3. 数据结构:复杂度分析以及数据结构整体概览
  4. 二进制在计算机电路中得到广泛的应用,电子技术与单片机的发展应用2喜欢就下吧(全文完整版)...
  5. BigData:绘制2018年福布斯中国富豪榜人名坐标地图(解决多个人名显示在同一个家乡地点)
  6. python数据结构之字典(dict)——超详细
  7. python-50: 验证码
  8. SGU 320 The Influence of the Mafia(BFS)
  9. [20] 鼓状物(Drum)图形的生成算法
  10. 如何有效看文献(一)
  11. CISSP-考纲分析
  12. 正态分布、对数正态分布参数(mu, sigma)与数据本身均值方差(m, v)的关系
  13. 一封来信,诉说了开源社区里的天涯若比邻
  14. Occupancy Grid Map(OGM:占用栅格地图)
  15. S3C2440裸机实战 之一 创建初始工程
  16. 简要介绍下tensorflow的计算图
  17. Leetcode1905. 统计子岛屿(medium)
  18. cf四大服务器位置,CF:从最初的42个服务器到现在的四大战区,穿越火线还能火多久?...
  19. java程序画米奇_儿童简笔画之拿着福字的米奇
  20. mrctf2020_shellcode_revenge(不用仔细分析汇编)

热门文章

  1. 推荐算法(3):利用用户标签数据
  2. 共享单车管理系统_共享单车将逐步告别银川!4万辆共享电单车陆续亮相,收费是这样…...
  3. 肖博高考数学二轮复习方法概率
  4. 用C++写一个计算向量夹角的代码
  5. 人民日报探店联想安定门店,联想智慧零售变革现成效
  6. 《绝地求生:大逃杀》百万级别数据分析项目,还有源码+数据
  7. 产品经理必备工具:SWOT、PDCA、6W2H、SMART、WBS、时间管理、二八原则
  8. 03 计算机科学家及程序员的Windows系统使用策略完全教程
  9. 1102: 火车票退票费计算(函数专题)C语言
  10. 【zzulioj】1102 火车票退票费计算