superl-url是一款开源的,并且功能强大的关键词URL采集工具,可以根据关键词,对搜索引擎内容检索结果的网址内容进行采集。可自动从搜索引擎采集相关网站的真实地址与标题等信息,可保存为文件,自动去除重复URL。同时,也可以自定义忽略多条域名。

优势介绍

1.支持多搜索引擎,很方便添加集成。(已内置了百度,搜狗,360),结构模块化,很方便进行扩展,可以无限添加。

2.开源,跨平台,使用python开发;

3.做了兼容性优化,同时支持python2和python3;

4.支持自动过滤重复内容,支持过滤标题中存在指定关键词的内容,支持过滤域名;

5.保存方式同时支持本地txt和mysql数据库;

6.从搜索引擎采集到的地址,是真实网站地址,不是像百度快照那样的三方地址;

7.多进程同时采集。每个搜索引擎都单独一个进程;

8.可灵活的通过配置文件自定义要保存的结果格式。比如只输出带参数的原始真实URL,或者只输出域名,或者同时输出标题,搜索引擎名称。

9.可自定义每页采集时间间隔,防止被屏蔽;

使用说明

1.安装python2或者python3运行环境;

2.如果提示没有找到库,则需要安装依赖:

如果是python3,则:

pip install ConfigParser

pip install tldextract

如果是Python2,则:

pip install tldextract

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple configparser

文章来源及下载:

https://github.com/super-l/superl-url

你可能喜欢

Snort - 开源网络入侵检测工具

mysql综合利用工具

多功能Python键盘记录工具:Radium

put url带参数_Superlurl 一款开源关键词URL采集工具相关推荐

  1. Superl-url:一款开源关键词URL采集工具

    superl-url是一款开源的,并且功能强大的关键词URL采集工具,可以根据关键词,对搜索引擎内容检索结果的网址内容进行采集.   程序主要运用于安全渗透测试项目,以及批量评估各类CMS系统0DAY ...

  2. put url带参数_避免自己写的 url 被diss!建议看看这篇RESTful API简明教程!

    RESTful API 是每个程序员都应该了解并掌握的基本知识,我们在开发过程中设计 API 的时候也应该至少要满足 RESTful API 的最基本的要求(比如接口中尽量使用名词,使用 POST 请 ...

  3. 7 款开源 Java 反编译工具

    7 款开源 Java 反编译工具 今天我们要来分享一些关于Java的反编译工具,反编译听起来是一个非常高上大的技术词汇,通俗的说,反编译是一个对目标可执行程序进行逆向分析,从而得到原始代码的过程.尤其 ...

  4. php动态添加查询,php动态添加url查询参数的方法,php动态url参数_PHP教程

    php动态添加url查询参数的方法,php动态url参数 本文实例讲述了php动态添加url查询参数的方法.分享给大家供大家参考.具体分析如下: 这段代码可以动态为url添加key-value查询参数 ...

  5. 页面url带参数_微信小程序云开发教程微信小程序的JS高级页面间数据传递

    同学们大家好,我是小伊同学,上一节课我们讲解了全局数据的读写方法,那么在页面间同样需要数据交互,今天我们就来学习这部分内容. 在微信小程序中,我们常常需要将数据在页面之间进行传递,比如用户的身份信息, ...

  6. Javascript JS 网页分享到QQ空间QQ,java实现qq分享,url带参数的方法

    网页js实现qq分享 创建一个jsp页面,html页面也行,下面是简单demo代码,直接复制到就能用 html把头 <%@ page language="java" cont ...

  7. 最强大脑!这 7 款开源思维导图工具真的很神奇

    2019独角兽企业重金招聘Python工程师标准>>> 思维导图,除了帮助概括提炼.归纳总结.理清楚思维逻辑之外,还是一种非常有效的学习方式,能激发联想力,再衍生出更多的想法. 本文 ...

  8. put url带参数_一道腾讯面试题:如何快速判断某 URL 是否在 20 亿的网址 URL 集合中?...

    来源:http://rrd.me/ekN8q 何为布隆过滤器 还是以上面的例子为例: 判断逻辑: 多次哈希: Guava的BloomFilter 创建BloomFilter 最终还是调用: 使用: 算 ...

  9. uniapp通过url带参数传值

    1.传参数如下 monthSelect: null,//定义url: 'drawerChild/drawerChild?data=' + encodeURIComponent(JSON.stringi ...

最新文章

  1. 在温系统下制作马克系统引导安装镜像启动U盘安装马克OS
  2. 开发可统计单词个数的Android驱动程序(2)
  3. MYSQL数据库索引设计的原则
  4. JavaScript tab页
  5. 研究Ajax(二)WebService实现加 减 乘 除
  6. Property Bags Object Model中的小“陷阱”
  7. 2021最新对比学习(Contrastive Learning)在各大顶会上的经典必读论文解读
  8. Java自学方法和路线,我万字推荐你这样学
  9. i3wm开启自动设置显示器顺序方向分辨率
  10. 海量数据搜索---demo展示百度、谷歌搜索引擎的实现
  11. 基于EAS的报销业务开展的先决条件
  12. 时序动作检测SSAD《Single Shot Temporal Action Detection》
  13. Boost.Geometry介绍
  14. PCL--学习笔记(持续更新——蜗速)
  15. kinit什么意思_kinit
  16. Python Opencv 之 简单的视频裁剪功能的实现
  17. 重心在哪里(简单数学题)
  18. 线性回归的几种评价方法
  19. 如何成为一个全能的机器人工程师
  20. VB学习过程(二)VB的语法基础和常用的内部函数

热门文章

  1. 数据科学家必备的5种离群点/异常检测方法
  2. kprobe与perf probe使用简单记录
  3. 随手笔记--为对象增加新的属性,拼接多个对象
  4. 怎么看python是64位还是32位_怎样查看python是64位还是32位
  5. Java学习笔记 (二十七) 使用NIO写文件
  6. 如果到来,会是怎样情况,fuck,
  7. java会员卡的绑定和解绑_java毕业设计_springboot框架的健身房会员卡管理
  8. 微信小程序之在线任务发布与接单平台(图)
  9. CVPR 2022 部分行人重识别
  10. Docker 镜像的存储机制