Python抓取打印机硒鼓和组件剩余量的爬虫

#coding:utf-8

import re,os,urllib,string

def getHtml(url):

page = urllib.urlopen(url)

html = page.read()

return html

def getData(html):

cartridge = r'Black Print Cartridge  (.+?%)'

car = re.compile(cartridge)

Cartridge = re.findall(car,html)

rekit = r'Maintenance Kit  (.+?%)'

kit = re.compile(rekit)

Kit = re.findall(kit,html)

print "Cartridge=%s" % Cartridge,

print "Kit=%s" % Kit

def getData_TFNRCPRT02(html):

cartridge = r'  (.+?%)'

car = re.compile(cartridge)

Cartridge = re.findall(car,html)

print "Cartridge=%s" % Cartridge

def IpStatus(ip):

Status = os.system("ping" + " " + ip)

return Status

def getIp(url):

getIp = r'http://(.+?)/'

GetIp = re.compile(getIp)

IpAddress = re.findall(GetIp,url)

ip = ''.join(IpAddress)

return ip

UrlDir = {

'http://10.132.160.171/hp/device/this.LCDispatcher' : 'LegalPrt04',

'http://10.132.160.172/hp/device/this.LCDispatcher' : 'LegalPrt05',

'http://10.153.24.177/hp/device/this.LCDispatcher' : 'SzPrt11' ,

'http://10.153.24.172/hp/device/this.LCDispatcher' : 'SzPrt13' ,

'http://10.153.26.179/hp/device/this.LCDispatcher' : 'SzPrt14' ,

'http://10.186.65.156/hp/device/this.LCDispatcher' : 'TfnrcPrt01',

'http://10.186.65.101/' : 'TfnrcPrt3390',

'http://10.153.25.200/' : 'SzPrt16'

}

for url in UrlDir:

ip = getIp(url)

Status = IpStatus(ip)

if Status == 0:

if url == 'http://10.186.65.101/':

html = getHtml(url)

print UrlDir[url]+":",

getData_TFNRCPRT02(html)

elif url == 'http://10.153.25.200/':

print "SZPRT16 is OK"

else:

html = getHtml(url)

print UrlDir[url]+":",

getData(html)

else:

print UrlDir[url] + ":"+"Ping fail"

转载于:https://blog.51cto.com/shine009/1279762

Python抓取打印机硒鼓和组件剩余量的爬虫相关推荐

python抓取直播源并更新_Python爬虫实例（二）使用selenium抓取斗鱼直播平台数据...
程序说明:抓取斗鱼直播平台的直播房间号及其观众人数,最后统计出某一时刻的总直播人数和总观众人数. 过程分析: 进入平台首页,来到页面底部点击下一页,发现url地址没有发生变化,这样的话再使用urlli ...
python 抓取微博评论破亿_Python爬虫实战演练：爬取微博大V的评论数据
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于IT共享之家 ,作者: IT共享者理论篇试想一个问题,如果我们要抓取某个微博大V ...
python抓取数据时失败_python网页爬虫之列车时刻表的抓取(5)-错误数据的处理
抓取了99%的数据还剩一点点瑕疵要处理掉. 在脚本的运行日志里不和谐的一段: 05-29 18:14 transchedule INFO train number 5611 processed 05- ...
python抓取微博数据中心_微博爬虫开源项目汇总大全
作者:阿橙网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自动索引.模 ...
python抓取pc端数据_「爬虫四步走」手把手教你使用Python抓取并存储网页数据！...
爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程.如果你还在入门爬虫 ...
python抓取腾讯视频弹幕_Python爬虫练习：腾讯视频弹幕数据采集
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理以下文章来源于菜鸟学Python数据分析 1.网页分析本文以爬取<脱 ...
python抓取简单网页_【Python3 爬虫】01_简单页面抓取
运行平台:Winodows 10 Python版本:Python 3.4.2 IDE:Sublime text3 网络爬虫网络爬虫,也叫网络蜘蛛(Web Spider),如果把互联网比喻成一个蜘蛛网 ...
微信好友大揭秘，使用Python抓取朋友圈数据，通过人脸识别全面分析好友，一起看透你的“朋友圈”...
微信:一个提供即时通讯服务的应用程序,更是一种生活方式,超过数十亿的使用者,越来越多的人选择使用它来沟通交流. 不知从何时起,我们的生活离不开微信,每天睁开眼的第一件事就是打开微信,关注着朋友圈里好友 ...
python爬取pdf教程_#如何利用Python抓取PDF中的某些内容#python爬取pdf教程
如何利用Python抓取PDF中的某些内容学生每天要学习,工作者要工作,家庭主妇每都要务.不论做什么,都有着相应的操作流同样就会有操作技巧.学生运用技巧学习才不会累,学得还会更快更多:工作者掌握技巧 ...

Python抓取打印机硒鼓和组件剩余量的爬虫

Python抓取打印机硒鼓和组件剩余量的爬虫相关推荐

最新文章

热门文章