#coding:utf-8

import re,os,urllib,string

def getHtml(url):

page = urllib.urlopen(url)

html = page.read()

return html

def getData(html):

cartridge = r'Black Print Cartridge  (.+?%)'

car = re.compile(cartridge)

Cartridge = re.findall(car,html)

rekit = r'Maintenance Kit  (.+?%)'

kit = re.compile(rekit)

Kit = re.findall(kit,html)

print "Cartridge=%s" % Cartridge,

print "Kit=%s" % Kit

def getData_TFNRCPRT02(html):

cartridge = r'  (.+?%)'

car = re.compile(cartridge)

Cartridge = re.findall(car,html)

print "Cartridge=%s" % Cartridge

def IpStatus(ip):

Status = os.system("ping" + " " + ip)

return Status

def getIp(url):

getIp = r'http://(.+?)/'

GetIp = re.compile(getIp)

IpAddress = re.findall(GetIp,url)

ip = ''.join(IpAddress)

return ip

UrlDir = {

'http://10.132.160.171/hp/device/this.LCDispatcher' : 'LegalPrt04',

'http://10.132.160.172/hp/device/this.LCDispatcher' : 'LegalPrt05',

'http://10.153.24.177/hp/device/this.LCDispatcher'  : 'SzPrt11'   ,

'http://10.153.24.172/hp/device/this.LCDispatcher'  : 'SzPrt13'   ,

'http://10.153.26.179/hp/device/this.LCDispatcher'  : 'SzPrt14'   ,

'http://10.186.65.156/hp/device/this.LCDispatcher'  : 'TfnrcPrt01',

'http://10.186.65.101/' : 'TfnrcPrt3390',

'http://10.153.25.200/' : 'SzPrt16'

}

for url in UrlDir:

ip = getIp(url)

Status = IpStatus(ip)

if Status == 0:

if url == 'http://10.186.65.101/':

html = getHtml(url)

print UrlDir[url]+":",

getData_TFNRCPRT02(html)

elif url == 'http://10.153.25.200/':

print "SZPRT16 is OK"

else:

html = getHtml(url)

print UrlDir[url]+":",

getData(html)

else:

print UrlDir[url] + ":"+"Ping fail"

转载于:https://blog.51cto.com/shine009/1279762

Python抓取打印机硒鼓和组件剩余量的爬虫相关推荐

  1. python抓取直播源 并更新_Python爬虫实例(二)使用selenium抓取斗鱼直播平台数据...

    程序说明:抓取斗鱼直播平台的直播房间号及其观众人数,最后统计出某一时刻的总直播人数和总观众人数. 过程分析: 进入平台首页,来到页面底部点击下一页,发现url地址没有发生变化,这样的话再使用urlli ...

  2. python 抓取微博评论破亿_Python爬虫实战演练:爬取微博大V的评论数据

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于IT共享之家 ,作者: IT共享者 理论篇 试想一个问题,如果我们要抓取某个微博大V ...

  3. python抓取数据时失败_python网页爬虫之列车时刻表的抓取(5)-错误数据的处理

    抓取了99%的数据还剩一点点瑕疵要处理掉. 在脚本的运行日志里不和谐的一段: 05-29 18:14 transchedule INFO train number 5611 processed 05- ...

  4. python抓取微博数据中心_微博爬虫开源项目汇总大全

    作者:阿橙 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自动索引.模 ...

  5. python抓取pc端数据_「爬虫四步走」手把手教你使用Python抓取并存储网页数据!...

    爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程.如果你还在入门爬虫 ...

  6. python抓取腾讯视频弹幕_Python爬虫练习:腾讯视频弹幕数据采集

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于菜鸟学Python数据分析 1.网页分析 本文以爬取<脱 ...

  7. python抓取简单网页_【Python3 爬虫】01_简单页面抓取

    运行平台:Winodows 10 Python版本:Python 3.4.2 IDE:Sublime text3 网络爬虫 网络爬虫,也叫网络蜘蛛(Web Spider),如果把互联网比喻成一个蜘蛛网 ...

  8. 微信好友大揭秘,使用Python抓取朋友圈数据,通过人脸识别全面分析好友,一起看透你的“朋友圈”...

    微信:一个提供即时通讯服务的应用程序,更是一种生活方式,超过数十亿的使用者,越来越多的人选择使用它来沟通交流. 不知从何时起,我们的生活离不开微信,每天睁开眼的第一件事就是打开微信,关注着朋友圈里好友 ...

  9. python爬取pdf教程_#如何利用Python抓取PDF中的某些内容#python爬取pdf教程

    如何利用Python抓取PDF中的某些内容 学生每天要学习,工作者要工作,家庭主妇每都要务.不论做什么,都有着相应的操作流同样就会有操作技巧.学生运用技巧学习才不会累,学得还会更快更多:工作者掌握技巧 ...

最新文章

  1. 开发板A/D转换原理
  2. 2021牛客第一场H.Hash Function—FFT求差值的卷
  3. HTML5-Tab标签
  4. html加入购物车的动画,关于购物车添加按钮的动画
  5. CSS中可以让文字在水平和垂直方向上重叠的两个属性
  6. PowerShell监控——监控共享打印机 获取打印记录、打印人员、打印文件等详细信息
  7. WTA (winner-take-all) 与 自组织映射 SOM (self organizing map)的理解
  8. 自然语言处理——句子的相似度
  9. 一篇述说“山寨”的文章,转过来大家看看。
  10. 题解 | Birthday Reminders-2019牛客暑期多校训练营第九场F题
  11. 2020年中国新基建人工智能产业链全景图深度分析汇总(附完整企业名单)
  12. Linux下Chelsio T5调试方法
  13. I3D泛读【Que Vadis,Action Recognition?A New Model and the Kinetics Dataset】
  14. 浅谈200M光纤宽带
  15. 第11课:生活中的组合模式——自己组装电脑
  16. 基于ESP插件的eCognition多尺度面向对象分割
  17. 百城价格房价周期和郑州、武汉房价比较分析
  18. skywalking了解及搭建使用
  19. Proteus8.9 VSM Studio PIC编译器仿真PIC16F630_系列001_LED
  20. COMSOL电化学基于燃料电池、纽扣电池、锂电池等多种案例

热门文章

  1. iOS 仿淘宝实现商品规格图片的放大缩小功能
  2. 信息系统安全等级保护备案任务详单
  3. [jQuery]Great Ways to Learn jQuery
  4. poj - problem 3070 Fibonacci 【矩阵 +快速幂】
  5. MD5,SHA-1,SHA-256摘要加解密
  6. Linux命令之cut详解
  7. 微软云计算介绍与实践(实践之一)
  8. PHP 输入/输出流
  9. [Linux] BASH程序设计
  10. 使用ubuntu 10.04中的中文乱码问题解决