作用

闲来无事,写个脚本,用来爬取[a-z0-9]范围内指定长度的域名的注册信息,将未注册的域名信息写入指定文件中,供兄弟们自己分析!

语言

作为一名javaer,这个脚本使用py开发。

使用

先将domain-crawling拉到本地

git clone https://gitee.com/ainilili/domain-crawling.git

进入目录中执行py脚本

cd domain-crawling

通过--help参数查看帮助

shell>> py domain-crawling.py -h
usage: domain-crawling.py [-h] [-p PATH] [-l LENGTH] [-o {y,n}] [-d DELAYED]Nico domain name crawler scriptoptional arguments:-h, --help            show this help message and exit-p PATH, --path PATH  The available domain name storage path afterdetection.-l LENGTH, --length LENGTHThe length of the domain you want to detect is allcombinations of a-z0-9.-o {y,n}, --openproxy {y,n}Open the IP proxy mode.-d DELAYED, --delayed DELAYEDThe interval between each climb, Unit s-s SUFFIX, --suffix SUFFIXDomain suffix

直接启动脚本:

shell>> py domain-crawling.py

指定域名长度启动脚本:

shell>> py domain-crawling.py --length 4

这时爬取的域名长度是4(默认也是4),例如:

aaaa.com
bbbb.com
cccc.com

指定爬取的域名(例如cn)后缀:

shell>> py domain-crawling.py --suffix cn

如果要开启代理(默认关闭):

shell>> py domain-crawling.py--openproxy y

如果更改数据保存文件(默认是时间戳.txt):

shell>> py domain-crawling.py --path data1

设置爬取间隔时间(默认是0.1s)为0.5s:

shell>> py domain-crawling.py --delayed 0.5

注意

笔者使用的是data5u的爬虫代理,如果您哟啊开启代理模式,脚本中自带的orderId很可能早已失效,请自行注册然后使用,如果您有更好的代理,可以更改源码替换之。

使用domain-crawling爬取所有未注册的域名相关推荐

  1. 未注册老域名扫描软件-免费未注册老域名挖掘

    未注册老域名挖掘教程 在SEO优化中,老域名的价值不言而喻,它们的搜索引擎权重.离线广告效果等都比新域名更高.然而,如何挖掘出高质量的老域名并进行注册并非易事.今天,我们将介绍一款名为"14 ...

  2. python爬虫爬取还未出版的《龙族5悼亡者的归来》小说

    本文开发环境: python环境:python3 安装的库:request.re.pymongo 文章目录 背景 实现步骤 一.选取目标网页 二. 使用request爬取目标网页 代码设计 三.目标完 ...

  3. 购买已备案未注册的域名的步骤

    养站群开始之前,挑选域名是重要的一步,域名也是养站群的第一步,做对第一步,后面对排名有着关键的影响,可以节省非常多的时间.那么我们应该怎么去挑选域名,这里分为下面几个步骤. 老域名选择 老域名并不一定 ...

  4. 已备案未注册老域名挖掘工具

    黑帽seo技术中,老域名排名技术的第一步就是需要老域名来配合. 通过注册老域名,老域名存在一定的反链,这些对于排名是非常有有用的. 本工具可以大量的挖掘老域名,然后筛选,筛选出适合做SEO优化的老域名 ...

  5. 站长之家网页模板爬取(未分页)

    #下载站长之家网站模板 import requests from lxml import etree import os if not os.path.exists('./moban1'):os.mk ...

  6. Search For Free —— 新闻爬虫及爬取结果的查询网站

    文章目录 一. 项目概述 1.1 核心需求 1.2 技术要求 二. demo展示 2.1 项目框架 2.2 演示demo视频 三. 网站分析 四.数据爬取 4.1 爬虫整体结构 4.2 使用的工具包 ...

  7. 简书爬ajax接口获取csrf,Python爬取简书主页信息

    主要学习如何通过抓包工具分析简书的Ajax加载,有时间再写一个Multithread proxy spider提升效率. 1. 关键点: 使用单线程爬取,未登录,爬取简书主页Ajax加载的内容.主要有 ...

  8. python爬网易歌单_Python爬取网易云歌单

    1. 关键点 使用单线程爬取,未登录,爬取网易云歌单主要有三个关键点: url为https://music.163.com/discover/playlist/?order=hot&cat=% ...

  9. 补天SRC漏洞挖掘(一):主域名爬取

    0x00 准备工作 补天账号 python3运行环境 requests等第三方库 CSS 选择器参考手册 0x01 流程分析 分别查看专属SRC.企业SRC.公益SRC对应URL,发现没有变化.初步判 ...

最新文章

  1. powershell的一个小游戏,看看能写几种方式出来
  2. Python:赋值语句和布尔值
  3. 精灵混合加密系统_数据安全——混合云的数据备份
  4. arthas命令使用示例:monitor监视指定方法的执行情况
  5. 搜索引擎排序DEMO
  6. 自动初始化 git Bash脚本
  7. gdb调试中出现optimized out
  8. Oracle sql中的正则表达式
  9. WLAN无线漫游详解
  10. python3手机版画图软件_Python实现画图软件功能方法详解
  11. c语言错误 cout不明确,C++ error: cout 不明确的符号
  12. 江南爱软装十大品牌 提升格调的软装种类
  13. 超详细的html+css基础知识树状图~HTML标签
  14. LeetCode 2248、多个数组求交集
  15. 虚拟机打不开是黑屏状态
  16. MATLAB的图像显示方法
  17. html5抓鱼游戏,小班捉小鱼游戏教案
  18. 全栈工程师眼中的HTTP
  19. 【神策数据面试】手撕题
  20. 诚之和:元宇宙的“诸神之战” 风口还是风险

热门文章

  1. medoo连接mysql_Medoo操作数据库
  2. 管道符号 - 竖直线 | Shell
  3. #Centos 7重置密码报错
  4. 总结CNC编程的工艺方法
  5. 未实名的.com/.net域名即将被暂停解析,网站/邮箱等无法访问!
  6. 网页被Chrome识别成英语,区域,语言,网站
  7. php怎么实现自动售货,PHP自动售货发卡网源码 集成多种支付接口
  8. Linux软件安装卸载(yum+rpm)
  9. InterValue项目双周报:20200601-20200614
  10. PMP每日⑤题(五)答案