使用domain-crawling爬取所有未注册的域名
作用
闲来无事,写个脚本,用来爬取[a-z0-9]
范围内指定长度的域名的注册信息,将未注册的域名信息写入指定文件中,供兄弟们自己分析!
语言
作为一名javaer,这个脚本使用py开发。
使用
先将domain-crawling拉到本地
git clone https://gitee.com/ainilili/domain-crawling.git
进入目录中执行py脚本
cd domain-crawling
通过--help
参数查看帮助
shell>> py domain-crawling.py -h
usage: domain-crawling.py [-h] [-p PATH] [-l LENGTH] [-o {y,n}] [-d DELAYED]Nico domain name crawler scriptoptional arguments:-h, --help show this help message and exit-p PATH, --path PATH The available domain name storage path afterdetection.-l LENGTH, --length LENGTHThe length of the domain you want to detect is allcombinations of a-z0-9.-o {y,n}, --openproxy {y,n}Open the IP proxy mode.-d DELAYED, --delayed DELAYEDThe interval between each climb, Unit s-s SUFFIX, --suffix SUFFIXDomain suffix
直接启动脚本:
shell>> py domain-crawling.py
指定域名长度启动脚本:
shell>> py domain-crawling.py --length 4
这时爬取的域名长度是4(默认也是4),例如:
aaaa.com
bbbb.com
cccc.com
指定爬取的域名(例如cn)后缀:
shell>> py domain-crawling.py --suffix cn
如果要开启代理(默认关闭):
shell>> py domain-crawling.py--openproxy y
如果更改数据保存文件(默认是时间戳.txt):
shell>> py domain-crawling.py --path data1
设置爬取间隔时间(默认是0.1s)为0.5s:
shell>> py domain-crawling.py --delayed 0.5
注意
笔者使用的是data5u的爬虫代理,如果您哟啊开启代理模式,脚本中自带的orderId很可能早已失效,请自行注册然后使用,如果您有更好的代理,可以更改源码替换之。
使用domain-crawling爬取所有未注册的域名相关推荐
- 未注册老域名扫描软件-免费未注册老域名挖掘
未注册老域名挖掘教程 在SEO优化中,老域名的价值不言而喻,它们的搜索引擎权重.离线广告效果等都比新域名更高.然而,如何挖掘出高质量的老域名并进行注册并非易事.今天,我们将介绍一款名为"14 ...
- python爬虫爬取还未出版的《龙族5悼亡者的归来》小说
本文开发环境: python环境:python3 安装的库:request.re.pymongo 文章目录 背景 实现步骤 一.选取目标网页 二. 使用request爬取目标网页 代码设计 三.目标完 ...
- 购买已备案未注册的域名的步骤
养站群开始之前,挑选域名是重要的一步,域名也是养站群的第一步,做对第一步,后面对排名有着关键的影响,可以节省非常多的时间.那么我们应该怎么去挑选域名,这里分为下面几个步骤. 老域名选择 老域名并不一定 ...
- 已备案未注册老域名挖掘工具
黑帽seo技术中,老域名排名技术的第一步就是需要老域名来配合. 通过注册老域名,老域名存在一定的反链,这些对于排名是非常有有用的. 本工具可以大量的挖掘老域名,然后筛选,筛选出适合做SEO优化的老域名 ...
- 站长之家网页模板爬取(未分页)
#下载站长之家网站模板 import requests from lxml import etree import os if not os.path.exists('./moban1'):os.mk ...
- Search For Free —— 新闻爬虫及爬取结果的查询网站
文章目录 一. 项目概述 1.1 核心需求 1.2 技术要求 二. demo展示 2.1 项目框架 2.2 演示demo视频 三. 网站分析 四.数据爬取 4.1 爬虫整体结构 4.2 使用的工具包 ...
- 简书爬ajax接口获取csrf,Python爬取简书主页信息
主要学习如何通过抓包工具分析简书的Ajax加载,有时间再写一个Multithread proxy spider提升效率. 1. 关键点: 使用单线程爬取,未登录,爬取简书主页Ajax加载的内容.主要有 ...
- python爬网易歌单_Python爬取网易云歌单
1. 关键点 使用单线程爬取,未登录,爬取网易云歌单主要有三个关键点: url为https://music.163.com/discover/playlist/?order=hot&cat=% ...
- 补天SRC漏洞挖掘(一):主域名爬取
0x00 准备工作 补天账号 python3运行环境 requests等第三方库 CSS 选择器参考手册 0x01 流程分析 分别查看专属SRC.企业SRC.公益SRC对应URL,发现没有变化.初步判 ...
最新文章
- powershell的一个小游戏,看看能写几种方式出来
- Python:赋值语句和布尔值
- 精灵混合加密系统_数据安全——混合云的数据备份
- arthas命令使用示例:monitor监视指定方法的执行情况
- 搜索引擎排序DEMO
- 自动初始化 git Bash脚本
- gdb调试中出现optimized out
- Oracle sql中的正则表达式
- WLAN无线漫游详解
- python3手机版画图软件_Python实现画图软件功能方法详解
- c语言错误 cout不明确,C++ error: cout 不明确的符号
- 江南爱软装十大品牌 提升格调的软装种类
- 超详细的html+css基础知识树状图~HTML标签
- LeetCode 2248、多个数组求交集
- 虚拟机打不开是黑屏状态
- MATLAB的图像显示方法
- html5抓鱼游戏,小班捉小鱼游戏教案
- 全栈工程师眼中的HTTP
- 【神策数据面试】手撕题
- 诚之和:元宇宙的“诸神之战” 风口还是风险