Scavenger是一款可在多个paste网站上搜索泄漏的凭据的工具。

Scavenger – OSINT Bot

自动化Snyk依赖以下扫描结果:

已知漏洞

处于活动中的bot

介绍

我的OSInt bot会在不同paste网站上搜索敏感数据泄漏。

当前支持搜索的内容如下:

用户凭据

RSA私钥

WordPress配置文件

MySQL连接字符串

Onion链接

托管在Onion网络内的文件链接(PDF、DOC、DOCX、XLS、XLSX)

这里我需要提前向大家说明下:

这个bot并不完美,而且也存在很多缺陷。我当时在编写它时只花了很短的时间,代码很粗造…我想说我从来不关心这些问题。

到目前为止,代码还未完成。该在线存储库中也并不完整,例如没有在数据库中集成凭据。PHP大马

如果你想使用此代码,那么请随意。但你必须自定义一些内容,以让其在你的系统上可以正常运行。

另外,它可能会存在一些误报的情况,并因此会错过一些可能对你而言非常重要的凭据。所以,如果你有更好的检测想法,那么请随时告诉我!

关于 Scavenger 的文章

https://jakecreps.com/2019/05/08/osint-collection-tools-for-pastebin/

https://jakecreps.com/2019/01/08/scavenger/

重要

bot可以在两种主要模式下运行:

API模式

爬取模式(使用TOR)

我强烈建议你使用API模式。这对于从Pastebin.com爬取pastes非常好用。你唯一需要的就是一个Pastebin.com PRO帐户,并在其网站上将你的公共IP添加到白名单中。

想要以API模式启动bot,只需按以下方式运行即可:

python run.py -0

但是,并不总是可以使用这种模式,在有些情况下例如你可能处于NAT模式,因此你没有专门的IP(将IP添加到白名单在这里是不合理的)。这也是为什么我实现了另一种爬取模式的原因。在这种模式下,快速的Tor循环与合理的用户代理结合使用,可避免IP锁定和Cloudflare验证码。

想要以爬取模式启动bot,只需按以下方式运行即可:

python run.py -1

重要说明:你需要在系统上安装TOR服务,侦听端口9050。此外,你还需要将以下行添加到/etc/tor/torrc文件中。

MaxCircuitDirtiness 30

这会将TOR的最大循环时间设置为30秒。

使用

想要了解有关该工具的更多使用信息,运行以下命令即可:

python run.py -h

输出内容如下:

  _________/   _____/ ____ _____ ___  __ ____   ____    ____   ___________\_____  \_/ ___\\__  \\  \/ // __ \ /    \  / ___\_/ __ \_  __ \/        \  \___ / __ \\   /\  ___/|   |  \/ /_/  >  ___/|  | \/
/_______  /\___  >____  /\_/  \___  >___|  /\___  / \___  >__|\/     \/     \/          \/     \//_____/      \/usage: run.py [-h] [-0] [-1] [-2] [-ps]Control software for the different modules of this paste crawler.optional arguments:-h, --help            show this help message and exit-0, --pastebinCOMapi  Activate Pastebin.com module (using API)-1, --pastebinCOMtor  Activate Pastebin.com module (standard scraping usingTOR to avoid IP blocking)-2, --pasteORG        Activate Paste.org module-ps, --pStatistic     Show a simple statistic.

到目前为止,我只实现了Pastebin.com模块,我正在使用Paste.org。未来我将添加更多模块并更新此脚本。

启动Pastebin.com模块(我实现的第一个模块):

python P_bot.py

Pastes被存储到了data/raw_pastes中,直到它们的数量超过了48000。当它们超过这个数时,它们就会被过滤、压缩并移动到归档文件夹中。包含凭据的所有Pastes都会被存储在data/files_with_passwords中。

记住,目前只能检测到USERNAME:PASSWORD以及一些简单的组合。但是,有一个工具可以帮助你搜索包含凭据的代理日志。

你可以使用getProxyLogs.py文件搜索代理日志(包含用户名和密码组合的URL)

python getProxyLogs.py data/raw_pastes

如果要在原始数据中搜索某些特定字符串,可以使用searchRaw.py(速度较慢)来完成。奇热影视

python searchRaw.py SEARCHSTRING

查看bot的统计信息:

python status.py 

文件findSensitiveData.py在文件夹(使用pastes)中搜索敏感数据,如信用卡,RSA密钥或mysqli_connect字符串。记住,此脚本使用grep,因此如果paste文件较大的话速度将非常的慢。如果你想分析大型的pastes文件,我建议你使用ELK-Stack。

python findSensitiveData.py data/raw_pastes 

stalk_user.py/stalk_user_wrapper.py有两个脚本,可用于监视特定的Twitter用户。这意味着他发布的每条推文都会被保存,并且每个包含的URL都会被下载。 执行以下命令,启动监控:

python stalk_user_wrapper.py

未来将要做的

我已发现了一些像Pastebin这样类似的网站,它们可以读取最新的paste并抓取它们。我需要将它们集成到我的bot中。如果你也发现了一些不错的网站,请告诉我们。

Examples:https://slexy.org/recenthttp://pastebin.frhttp://pastebin.es/listshttp://pastebin.it/archive.php

*参考来源:GitHub,

Scavenger:在不同的paste网站上搜索泄漏的凭据相关推荐

  1. 在不同的paste网站上搜索泄漏的凭据Scavenger

    Scavenger是一款可在多个paste网站上搜索泄漏的凭据的工具. Scavenger – OSINT Bot 自动化Snyk依赖以下扫描结果: 已知漏洞 处于活动中的bot 介绍 我的OSInt ...

  2. 网站搜索功能怎么实现_电商网站上的搜索功能是如何实现的?

    今天是刘小爱自学Java的第159天. 感谢你的观看,谢谢你. 学习计划安排如下: 索引库本质上和数据库类似,也是存储数据的,既然如此自然也会有增删改查. 那么这个索引库到底有何特别应用呢? 索引库的 ...

  3. STM32 Tips:如何从ST官方网站上下载STM32标准外设库(STM32F10x standard peripheral library)

    入手了一块STM32F107VCT6开发板,配置开发环境时需要一个库:STM32F10x标准外设库(STM32F10x standard peripheral library),在网上看到很多初学者和 ...

  4. [Python爬虫实战2]爬取济南安居客网站上所需街区的二手房平均房价数据

    文章目录 一.项目简介 二.安居客网页分析 1.整体分析 2.细节分析 2.1提取一个页面所有的房源信息 2.2提取每个房源信息中的信息 2.3如何爬取下一页的房源信息 三.程序编写 1.数据去重 2 ...

  5. 你社交网站上的照片,也许已经被用来训练人工智能了

    来源:网易智能 斯特于2013年拍摄的这张照片被收录在IBM的人像数据集(Diversity in Faces)中 毫无疑问,这张家庭照片是非常可爱的:照片中的爸爸留着短须,戴着无框眼镜,棕色头发的妈 ...

  6. 优化了破网站的搜索功能

    使用 ES + 云开发实战优化网站搜索 大家好,我是鱼皮,今天搞一场技术实战,需求分析 => 技术选型 => 设计实现,从 0 到 1,带大家优化网站搜索的灵活性. ES + 云开发搜索优 ...

  7. node 后台文章编辑器_我如何使用Node从报纸网站上刮掉7000篇文章

    node 后台文章编辑器 我为什么要这样做? (Why did I do this?) My girlfriend is writing a paper about the perception of ...

  8. 免费人脸识别工具可以跟踪社交媒体网站上的人

    2019独角兽企业重金招聘Python工程师标准>>> 2018年8月9日,斯瓦蒂·汗德瓦尔(Swati Khandelwal 原文地址:https://thehackernews. ...

  9. memcached在大负载高并发网站上的应用(一)

    大家可能对memcached这种产品早有了解,或者已经应用在自己的网站中了,但是也有一些朋友从来都没有听说过或者使用过. 这都没什么关系,本文旨在从各个角度综合的介绍这种产品,尽量深入浅出,如果能对您 ...

最新文章

  1. python实现简单爬虫功能(网站图片)
  2. 双12众商超沦陷,你是否习惯了扮演观众?
  3. matlab x为整数,关于matlab中用什么字符表示任意整数
  4. Vue 电商PC后台管理(ElementUI)
  5. 标准时间校对_颜色校对很难?瑞锌五金工具对色灯箱强势来袭
  6. 第二阶段冲刺 第四天
  7. vite方式创建vue项目
  8. 博文视点程序员读书节,大咖带你共读十日精彩
  9. 091 类的多态和多态性
  10. 重装上阵两个人合体机器人_又一部热门定档!林超贤、彭于晏领衔《紧急救援》重装定档2021年大年初一...
  11. Odoo14免费开源ERP实施手册:销售功能高级应用
  12. arcmap中图斑面积代表_arcmap计算面积_ArcMap怎么重计算图斑面积?arcmap使用手册_arcmap计算面积...
  13. 哔哩哔哩助手:玩转B站、全速下载、夜间模式、画中画 等功能
  14. 穿山甲(巨量引擎)广告接入
  15. python应聘项目经历怎么写_简历中、面试中,怎么描述你的工作/项目经历?
  16. 如何逃出【 AI 换脸的世界】
  17. 一键生成iosandroid应用图标
  18. 从零开始学java(二十六)--多维数组,多维数组存储表格数据
  19. uni app 自动化索引列表
  20. Type.GetType()在跨程序集反射时返回null的解决方法

热门文章

  1. 激光雷达和相机的坐标转换以及联合标定
  2. 【嵌入式】初学者一步一步搞懂内存管理
  3. gb和gib的区别_GB 和 GiB 的区别
  4. 联想650服务器做系统,联想RD650阵列 安装系统步骤
  5. 最新版发布,快扶我起来,Android 13 现已正式发布至 AOSP
  6. 系统准备工具 (Sysprep.exe) 实现OOBE用法
  7. 5e平台能在linux,国服玩家正常使用5E对战平台的指引
  8. 局域网arp攻击_Window应急响应(五):ARP病毒
  9. 一键免费下载全网在线视频素材,自己动手丰衣足食
  10. nginx与httpd 优雅重启