批量查询IP位置和信誉信息
import requests
from lxml import etree
import ssl
ssl._create_default_https_context = ssl._create_unverified_contextrequests.packages.urllib3.disable_warnings()#忽略警告
filename="ip_black_file.txt"
result="ipip.csv"
url="https://www.ipip.net/ip.html"page_headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0','Connection': 'keep-alive','Content-Type':'application/x-www-form-urlencoded','Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8'}def url_open(check_ip):try:post_data={'ip':check_ip}res=requests.post(url,headers=page_headers,data=post_data,verify=False)status=res.status_codecontent=res.text#print(status)return status,contentexcept Exception as e:return 0,0def check_ipip(check_ip):try:status,content=url_open(check_ip)if status==200:html=etree.HTML(content)tag=html.xpath('//div[@class="outer tableNormal ipSearch"]//div[@class="inner"]//table//tr//td/span/text()')tag=str(tag[1:]).replace("(更多数据请查看', ')","").replace(", ' '","").replace("(', ')","").replace("', '","';'").replace(" ","").replace("['","").replace("']","").replace("'","")#print(tag)return tagelse:return "查询失败"except Exception as e:print(str(e))return "查询失败"if __name__=="__main__":  with open(filename,'r',encoding='utf-8') as fh:data=fh.read().split('\n')with open(result,'a+',encoding='utf-8') as f:for ip in data:if len(ip)>0:print("正在查询IP:"+ip)tag=check_ipip(ip)f.write(ip+";"+tag+'\n')

ipip.net IP位置信誉信息爬取相关推荐

  1. 利用动态渲染页面对京东笔记本电脑信息爬取

    写在前面 之前写过一个爬取京东商品的Scrapy爬虫项目,但是里面价格及评论数是通过逆向工程法获得的,在不使用代理ip的情况下,在爬取一定数量的商品后会被持续要求输入验证码.所以这里写出利用动态页面渲 ...

  2. 爬虫实战系列!淘宝店铺各品牌手机售卖信息爬取及可视化!

    声明:本博客只是简单的爬虫示范,并不涉及任何商业用途. 一.前言 最近博主在浏览淘宝时突然萌发了一个想爬它的念头,于是说干就干,我便开始向淘宝"下毒手"了.由于本人平时经常喜欢在淘 ...

  3. 爬虫实战系列(八):淘宝店铺各品牌手机售卖信息爬取及可视化

    声明:本博客只是简单的爬虫示范,并不涉及任何商业用途. 一.前言 最近博主在浏览淘宝时突然萌发了一个想爬它的念头,于是说干就干,我便开始向淘宝"下毒手"了.由于本人平时经常喜欢在淘 ...

  4. 淘宝店铺各品牌手机售卖信息爬取及可视化!

    一.前言 最近博主在浏览淘宝时突然萌发了一个想爬它的念头,于是说干就干,我便开始向淘宝"下毒手"了.由于本人平时经常喜欢在淘宝上浏览各种手机的信息,于是我便以"手机&qu ...

  5. 12306车站信息爬取(4)——添加车票的票价信息

    在前三篇文章的基础上: 12306车站信息爬取(1)--输入条件的判断,包括出发站,到达站,和出发时间,并获取车次信息的链接 12306车站信息爬取(2)--输入出发站,到达站和出发时间,获取车次信息 ...

  6. 广西人才网实习信息爬取与数据库存储实战

    广西人才网实习信息爬取与数据库存储实战 https://www.gxrc.com/ 大家好,我是W 项目介绍:本项目为CrawlSpider结合MySQL.MongoDB爬取求职网站信息的项目,目标是 ...

  7. Scrapy框架爬虫项目:京东商城笔记本电脑信息爬取

    一.创建Scrapy项目 在cmd中输入一下指令创建一个新的scrapy项目及一个爬虫 scrapy startproject JD_Goodscd JD_Goodsscrapy genspider ...

  8. 爬虫第三弹:图灵社区书籍信息爬取

    爬虫第三弹:图灵社区书籍信息爬取 一.目的:将图灵社区所有书籍的网址.书籍名称,作者,译者,阅读数,标签,出版日期,定价,页数,印刷方式,出版状态全部爬取下来存入mysql数据库,并导出xml格式,最 ...

  9. Python3 pyspider(二)大众点评商家信息爬取

    大众点评商家信息爬取 首页信息:http://www.dianping.com/ 我是按照城市----商家出售的商品类型----分页----商家----爬取 城市: 出售商品类型: 分页:(应该是反爬 ...

最新文章

  1. OC画笔CGContextRef
  2. android actviity模糊,Framework启动过程浅析
  3. jsp2自定义标签开篇
  4. mysql qps如何查看_一款查看mysql QPS的脚本
  5. lucene 查询示例_高级Lucene查询示例
  6. 解决win10使用GPU跑程序遇到的一系列报错
  7. 基于JAVA+SpringBoot+Mybatis+MYSQL的社团管理系统
  8. 汉王ocr sdk android,汉王标准印刷体OCR SDK技术白皮书.doc
  9. 计算机多媒体技术广泛应用于各个领域,计算机多媒体技术的现状及发展前景
  10. 基于阿里云的系统灾备方法架构与安全应急预案介绍
  11. UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\u25aa‘ in position 11923: illegal multibyte
  12. 12306Bypass-分流抢票 火车票抢票攻略
  13. 动作游戏的打击感和音效的关系
  14. html判断eq相反,HTML中Smarty中的if语句条件修饰词eq相等ne、neq不相等,gt大于
  15. 分析 | 多视角下图情热点分析与真题分析
  16. [时间序列分析][1]--平稳性,白噪声的检验
  17. Linux学习:文件和用户管理——文件管理命令
  18. 文件恢复软件哪个最好用?5 款最佳照片文件恢复软件
  19. 掘安杯原题复现---Web签到题
  20. console.log(console.log) = ?

热门文章

  1. 32位64位Eclipse和jdk对应关系说明【初学者适用】
  2. zufe 2527问题 K: Jelly与狗头人的地下世界
  3. 为第九大股东;此前40次增持民生银行A股股份
  4. 驾培行业应对新形势“自学直考”新格局冲击剖析
  5. 关于微信防撤回(文本、图片、语音、视频、名片等...)的Python学习教程
  6. 01【股票初级】-【找准入场时机】投资五大流派,好公司投资法,判断单只股票是否便宜?如何找准时机入场?
  7. 洗礼灵魂,修炼python(56)--爬虫篇—知识补充—编码之url编码
  8. 云HIS(二级医院,乡镇医院,民营医院,标准化HIS医院信息管理系统源码)
  9. 教你几种方法最大限度减轻酒精对你身体的伤害
  10. Hybrid端口的工作原理