Python抓取打印机硒鼓和组件剩余量的爬虫
#coding:utf-8
import re,os,urllib,string
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getData(html):
cartridge = r'Black Print Cartridge (.+?%)'
car = re.compile(cartridge)
Cartridge = re.findall(car,html)
rekit = r'Maintenance Kit (.+?%)'
kit = re.compile(rekit)
Kit = re.findall(kit,html)
print "Cartridge=%s" % Cartridge,
print "Kit=%s" % Kit
def getData_TFNRCPRT02(html):
cartridge = r' (.+?%)'
car = re.compile(cartridge)
Cartridge = re.findall(car,html)
print "Cartridge=%s" % Cartridge
def IpStatus(ip):
Status = os.system("ping" + " " + ip)
return Status
def getIp(url):
getIp = r'http://(.+?)/'
GetIp = re.compile(getIp)
IpAddress = re.findall(GetIp,url)
ip = ''.join(IpAddress)
return ip
UrlDir = {
'http://10.132.160.171/hp/device/this.LCDispatcher' : 'LegalPrt04',
'http://10.132.160.172/hp/device/this.LCDispatcher' : 'LegalPrt05',
'http://10.153.24.177/hp/device/this.LCDispatcher' : 'SzPrt11' ,
'http://10.153.24.172/hp/device/this.LCDispatcher' : 'SzPrt13' ,
'http://10.153.26.179/hp/device/this.LCDispatcher' : 'SzPrt14' ,
'http://10.186.65.156/hp/device/this.LCDispatcher' : 'TfnrcPrt01',
'http://10.186.65.101/' : 'TfnrcPrt3390',
'http://10.153.25.200/' : 'SzPrt16'
}
for url in UrlDir:
ip = getIp(url)
Status = IpStatus(ip)
if Status == 0:
if url == 'http://10.186.65.101/':
html = getHtml(url)
print UrlDir[url]+":",
getData_TFNRCPRT02(html)
elif url == 'http://10.153.25.200/':
print "SZPRT16 is OK"
else:
html = getHtml(url)
print UrlDir[url]+":",
getData(html)
else:
print UrlDir[url] + ":"+"Ping fail"
转载于:https://blog.51cto.com/shine009/1279762
Python抓取打印机硒鼓和组件剩余量的爬虫相关推荐
- python抓取直播源 并更新_Python爬虫实例(二)使用selenium抓取斗鱼直播平台数据...
程序说明:抓取斗鱼直播平台的直播房间号及其观众人数,最后统计出某一时刻的总直播人数和总观众人数. 过程分析: 进入平台首页,来到页面底部点击下一页,发现url地址没有发生变化,这样的话再使用urlli ...
- python 抓取微博评论破亿_Python爬虫实战演练:爬取微博大V的评论数据
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于IT共享之家 ,作者: IT共享者 理论篇 试想一个问题,如果我们要抓取某个微博大V ...
- python抓取数据时失败_python网页爬虫之列车时刻表的抓取(5)-错误数据的处理
抓取了99%的数据还剩一点点瑕疵要处理掉. 在脚本的运行日志里不和谐的一段: 05-29 18:14 transchedule INFO train number 5611 processed 05- ...
- python抓取微博数据中心_微博爬虫开源项目汇总大全
作者:阿橙 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自动索引.模 ...
- python抓取pc端数据_「爬虫四步走」手把手教你使用Python抓取并存储网页数据!...
爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程.如果你还在入门爬虫 ...
- python抓取腾讯视频弹幕_Python爬虫练习:腾讯视频弹幕数据采集
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于菜鸟学Python数据分析 1.网页分析 本文以爬取<脱 ...
- python抓取简单网页_【Python3 爬虫】01_简单页面抓取
运行平台:Winodows 10 Python版本:Python 3.4.2 IDE:Sublime text3 网络爬虫 网络爬虫,也叫网络蜘蛛(Web Spider),如果把互联网比喻成一个蜘蛛网 ...
- 微信好友大揭秘,使用Python抓取朋友圈数据,通过人脸识别全面分析好友,一起看透你的“朋友圈”...
微信:一个提供即时通讯服务的应用程序,更是一种生活方式,超过数十亿的使用者,越来越多的人选择使用它来沟通交流. 不知从何时起,我们的生活离不开微信,每天睁开眼的第一件事就是打开微信,关注着朋友圈里好友 ...
- python爬取pdf教程_#如何利用Python抓取PDF中的某些内容#python爬取pdf教程
如何利用Python抓取PDF中的某些内容 学生每天要学习,工作者要工作,家庭主妇每都要务.不论做什么,都有着相应的操作流同样就会有操作技巧.学生运用技巧学习才不会累,学得还会更快更多:工作者掌握技巧 ...
最新文章
- 开发板A/D转换原理
- 2021牛客第一场H.Hash Function—FFT求差值的卷
- HTML5-Tab标签
- html加入购物车的动画,关于购物车添加按钮的动画
- CSS中可以让文字在水平和垂直方向上重叠的两个属性
- PowerShell监控——监控共享打印机 获取打印记录、打印人员、打印文件等详细信息
- WTA (winner-take-all) 与 自组织映射 SOM (self organizing map)的理解
- 自然语言处理——句子的相似度
- 一篇述说“山寨”的文章,转过来大家看看。
- 题解 | Birthday Reminders-2019牛客暑期多校训练营第九场F题
- 2020年中国新基建人工智能产业链全景图深度分析汇总(附完整企业名单)
- Linux下Chelsio T5调试方法
- I3D泛读【Que Vadis,Action Recognition?A New Model and the Kinetics Dataset】
- 浅谈200M光纤宽带
- 第11课:生活中的组合模式——自己组装电脑
- 基于ESP插件的eCognition多尺度面向对象分割
- 百城价格房价周期和郑州、武汉房价比较分析
- skywalking了解及搭建使用
- Proteus8.9 VSM Studio PIC编译器仿真PIC16F630_系列001_LED
- COMSOL电化学基于燃料电池、纽扣电池、锂电池等多种案例