域名带后缀_[Python 爬虫]获取顶级域名及对应的 WHOIS Server 及 whoisservers.txt 下载...

使用 Python 爬虫获取顶级域名及对应的 WHOIS Server 并保存可用于 WhoisCL.exe 的文件 whois-servers.txt。
环境：

Windows 10
Python 3.9.1

顶级域名列表https://www.iana.org/domains/root/db获取顶级域名的 WHOIS Server点击带查询的顶级域名，往下拉 WHOIS Server每个域名后缀对应的 WHOIS Server 是不一样的。安装 beautifulsoup4 库

pip install beautifulsoup4

安装 requests 库

python -m pip install requests

获取顶级域名列表

import requests from bs4 import BeautifulSoup iurl = 'https://www.iana.org/domains/root/db' res = requests.get(iurl, timeout=600) res.encoding = 'utf-8' soup = BeautifulSoup(res.text, 'html.parser') list1 = [] list2 = [] jsonStr = {} for tag in soup.find_all('span', class_='domain tld'):     d_suffix = tag.get_text()     print(d_suffix)

获取顶级域名及对应的 WHOIS Server 并保存可用于 WhoisCL.exe 的文件 whois-servers.txt

import requests from bs4 import BeautifulSoup import re import time iurl = 'https://www.iana.org/domains/root/db' res = requests.get(iurl, timeout=600) res.encoding = 'utf-8' soup = BeautifulSoup(res.text, 'html.parser') list1 = [] list2 = [] jsonStr = {} for tag in soup.find_all('span', class_='domain tld'):     d_suffix = tag.get_text()     print(d_suffix)     list2.append(d_suffix)     n_suffix = d_suffix.split('.')[1]     new_url = iurl + '/' + n_suffix     server = ''     try:         res2 = requests.get(new_url, timeout=600)         res2.encoding = 'utf-8'         soup2 = BeautifulSoup(res2.text, 'html.parser')    retxt = re.compile(r'WHOIS Server: (.*?)\n')     arr = retxt.findall(res2.text)     if len(arr) > 0:         server = arr[0]         list2.append(server)     print(server)     time.sleep(1) except Exception as e:     print('超时') with open('whois-servers.txt', "a", encoding='utf-8') as my_file:     my_file.write(n_suffix + " " + server+'\n') print('抓取结束')

whois-servers.txt 在公众号中回复

whois-servers.txt

域名带后缀_[Python 爬虫]获取顶级域名及对应的 WHOIS Server 及 whoisservers.txt 下载...相关推荐

用几个最简单的例子带你入门 Python 爬虫
作者 | ZackSock 来源 | 新建文件夹X(ID:ZackSock) 头图 | CSDN下载自视觉中国前言爬虫一直是Python的一大应用场景,差不多每门语言都可以写爬虫,但是程序员们却独 ...
图解爬虫，用几个最简单的例子带你入门Python爬虫
一.前言爬虫一直是Python的一大应用场景,差不多每门语言都可以写爬虫,但是程序员们却独爱Python.之所以偏爱Python就是因为她简洁的语法,我们使用Python可以很简单的写出一个爬虫程序 ...
带你入门Python爬虫
点击关注我哦一篇文章带你了解Python爬虫数据科学只有通过数据才能实现,而在现实世界中,数据通常不会有现成的.csv文件等你使用.你必须去自己寻找.这就是为什么爬虫对数据科学非常重要的原因. 但 ...
Python爬虫获取异步加载站点pexels并下载图片(Python爬虫实战3)
Python爬虫获取异步加载站点pexels并下载图片(Python爬虫实战3) 1. 异步加载爬虫对于静态页面爬虫很容易获取到站点的数据内容,然而静态页面需要全量加载站点的所有数据,对于网站的访问 ...
python爬虫获取网络图片
python爬虫获取网络图片记录一下利用爬虫获取网络图片具体操作来自博客:Python 爬虫系列教程一爬取批量百度图片我的编辑器是vscode,首先安装三个包 pip install Beaut ...
手把手带你飞Python爬虫+数据清洗新手教程（一）
本文共有2394字,读完大约需要10分钟. 目录简介思考撸起袖子开始干 1 获取网页源代码 2 在网页源代码里找出所需信息的位置 3 数据清洗 4 完整代码 5 优化后的代码简介本文使用An ...
python爬虫获取豆瓣图书Top250
在上一篇博客<python爬虫获取豆瓣电影TOP250>中,小菌为大家带来了如何将豆瓣电影Top250的数据存入MySQL数据库的方法.这次的分享,小菌决定再带着大家去研究如何爬取豆瓣图片 ...
Python爬虫获取文章的标题及你的博客的阅读量，评论量。所有数据写入本地记事本。最后输出你的总阅读量！
Python爬虫获取文章的标题及你的博客的阅读量,评论量.所有数据写入本地记事本.最后输出你的总阅读量!还可以进行筛选输出!比如阅读量大于1000,之类的! 完整代码在最后.依据阅读数量进行降序输出! ...
python Chrome + selenium自动化测试与python爬虫获取网页数据
一.使用Python+selenium+Chrome 报错: selenium.common.exceptions.SessionNotCreatedException: Message: sessi ...

域名带后缀_[Python 爬虫]获取顶级域名及对应的 WHOIS Server 及 whoisservers.txt 下载...

whois-servers.txt 在公众号中回复

域名带后缀_[Python 爬虫]获取顶级域名及对应的 WHOIS Server 及 whoisservers.txt 下载...相关推荐

最新文章

热门文章