前言:最近一段时间老大给我一大批网站域名,让我帮忙查询这些网站域名对应的网站名称。作为一个IT屌丝,这种事情不可能手动一个一个去查询,于是决定写个自动化脚本去查询。

思路:网上有很多域名查询的网站,但是大部分都是要验证码的,这样的话对于编写脚本的难度就增加了很多。千辛万苦找到了一个http://icp.chinaz.com/。于是就开始编写脚本,由于近段时间在学习selenium所以就用它的框架去写。

功能:读取txt文件中的域名,然后查询域名对应的网站名称,查询结束后把结果写入excel表格里。

废话不多说,直接上代码:

# -*- coding: utf-8 -*-
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import Select
from selenium.common.exceptions import NoSuchElementException
from selenium.common.exceptions import NoAlertPresentException
import unittest, time, re
import xlwtclass Myurltest(unittest.TestCase):def setUp(self):self.driver = webdriver.Firefox()self.driver.implicitly_wait(30)self.base_url = "http://icp.chinaz.com/"self.verificationErrors = []self.accept_next_alert = Truedef test_myurl(self):driver = self.driverdriver.get(self.base_url + "/")driver.maximize_window()f=open("newurl.txt",'rb+')line=f.readlines()book = xlwt.Workbook(encoding='utf-8',style_compression=0)sheet=book.add_sheet(u'data',cell_overwrite_ok=True)for i in range(len(line)):driver.find_element_by_id("s").clear()driver.find_element_by_id("s").send_keys(line[i])driver.find_element_by_id("search").click()try:driver.implicitly_wait(0.5)data=driver.find_element_by_xpath("//div/ul[@id='first']/li[4]/p").textexcept NoSuchElementException,e:sheet.write(i,0,line[i])sheet.write(i,1,u"没查到")print u"没查到"continueprint line[i],print datasheet.write(i,0,line[i])sheet.write(i,1,data)book.save('myurl.xls')def is_element_present(self, how, what):try: self.driver.find_element(by=how, value=what)except NoSuchElementException, e: return Falsereturn Truedef is_alert_present(self):try: self.driver.switch_to_alert()except NoAlertPresentException, e: return Falsereturn Truedef close_alert_and_get_its_text(self):try:alert = self.driver.switch_to_alert()alert_text = alert.textif self.accept_next_alert:alert.accept()else:alert.dismiss()return alert_textfinally: self.accept_next_alert = Truedef tearDown(self):self.driver.quit()self.assertEqual([], self.verificationErrors)if __name__ == "__main__":unittest.main()

python批量查询网站名称相关推荐

  1. python网页批量查询_批量查询网站的pr

    段时间工作比较忙,博客更新的时间又慢了,前几天刚旅游回来,和部门的同事去了富春江-三清山和姚林仙境,感觉挺不错的,坐了船也爬了山.感受了大自然的秀丽景色.废话不多话,今天给大家分享个python 批量 ...

  2. python 批量查询网页导出结果_python批量查询网页的HTTP状态码

    最近业余时间在改版一个网站,改版之前频繁调整了一些栏目的属性,包括栏目的层级,这种最怕就是调整了栏目的从属关系,导致了栏目的URL地址改变,一旦改版就导致整个栏目及其下面的文章页地址变更,成为死链.而 ...

  3. BlueCatTools 批量查询网站的百度收录量,快照和外链的工具

    BlueCatTools 批量查询网站的百度收录量,快照和外链的工具 BlueCatTools 官方博客 http://bluecattools.zskame.com/ 具体要求: 要求可能有点多,但 ...

  4. 网站域名备案查询方法,批量查询网站域名备案的教程

    网站域名备案查询方法,批量查询网站域名备案的教程 批量查域名备案操作步骤: 第一步.打开SEO综合查询工具. 第二步.添加需要查询的网站域名(要查多少放多少,一行一个域名). 第三步.勾选域名ICP备 ...

  5. 用Python批量修改图片名称及后缀名

    用Python批量修改图片名称及后缀名 import os a = 'dataset3\png/'//需要修改的图片所在的文件夹 b = 'dataset2\png/'//修改后的图片存放路径 fil ...

  6. 怎样批量查询网站是否被搜狗收录?批量查询网站搜狗收录的详细教程

    怎样批量查询网站是否被搜狗收录?批量查询网站搜狗收录的详细教程 批量查询网站搜狗收录的的具体操作: 第一步.打开站长工具 第二步.添加需要查询的网站域名 第三步.勾选要查询的功能(勾选搜狗是否收录和搜 ...

  7. python批量查询豆瓣书籍评分(教程附源码)

    在懒人盘分享的高分电子书是利用python批量查询得到的 发现常规的豆瓣api不允许调用了,几番搜索发现一个接口 https://book.douban.com/j/subject_suggest?q ...

  8. 网站权重怎么批量查?怎么批量查询网站的360权重

    批量查询网站360权重的操作: 第一步.打开SEO综合查询工具 第二步.添加需要查询的网站域名(有多少放多少,一行一个域名) 第三步.勾选360权重PC权重和360移动权重 第四步.点击开始查询 第五 ...

  9. 谷歌索引量查询,批量查询网站在谷歌RR权重值

      google索引量查询     谷歌索引页面决定的了你的网页是否能够参与关键词排名.那么提高谷歌索引对于做谷歌SEO的各位站长来说是非常重要的一个工作.在提高谷歌索引中最为核心的一个环节就是向Go ...

最新文章

  1. jenkins自动打包设置打包文件脚本
  2. Android多线程分析之一:使用Thread异步下载图像
  3. Python如何实现数据可视化
  4. 【线段树】GSS5 - Can you answer these queries V(luogu-SPOJ 2916)
  5. 截止到2013年,核心Java帖子
  6. Spring Boot 永远滴神!10分钟快速入门
  7. php软件开发--laravel框架
  8. 国内物联网平台初探(二) ——阿里云物联网套件
  9. Motorola ME525 刷机教程
  10. 苹果手机上网速度慢_是什么原因导致手机网速慢!
  11. android intent scheme,android Scheme使用 打开指定的Activity
  12. Linux 自签名ssl证书生成
  13. 【翻译】开发人员的技术写作
  14. Linux C 遍历目录下的所有文件
  15. import pmdarima as pm时报错ModuleNotFoundError: No module named ‘statsmodels‘
  16. 美国光纤通信展归来:光时代的MPO应用无法抗拒
  17. 传递Bitmap + 图片压缩处理 并保存 + 壁纸设置 总结
  18. vue 点击获取当前时间上/下周 整周数据
  19. PTA-JAVA-类和对象
  20. 如何自学编程(三)-初学者应该知道的一些事

热门文章

  1. C#-继承-隐藏方法
  2. vue 踩坑--父组件调用子组件方法,报错
  3. Javascript常用的数组方法
  4. 数组方法中,会改变原数组、不会改变原数组的方法有哪些?
  5. 苹果 iOS 第三方应用商店在欧盟上线,开发者并非都很兴奋
  6. 筑基2期来了,鼓励师阵容强大!同学更是了不得(送封面啦)
  7. Mercurial hg轻量级分布式版本控制系统
  8. 为什么python制作图表空白_解决Python plt.savefig 保存图片时一片空白的问题
  9. windowsserver2008r2可以装什么模拟器_无论什么都能模拟?各式各样的模拟器挑战人类极限!...
  10. 太阳光线为什么是近似平行的?------余弦定理搞起