#!/usr/bin/python
#-*- coding:utf-8 -*-
'''
此脚本主要实现网页的点击量,除了实现次功能点外,还有三个知识点:
1、随机获取代理ip,通过代理ip访问指定站点,其目的是防止ip被封
2、访问一个页面后,随机休息几秒,再访问,其目的是防止网站前面有4-7层过滤设备拦截
3、修改http的user agent字段,有些网站和4-7层设备会检查
'''import urllib2,re,time,urllib,random,user_agents
PROXYIPURL = 'http://www.goodips.com/?ip=&port=&dengji=&adr=%E7%94%B5%E4%BF%A1&checktime=&sleep=1%E7%A7%92%E5%86%85&cunhuo=48%E5%B0%8F%E6%97%B6%E4%BB%A5%E4%B8%8A&px='class getProxyIP:
#   从网页抓去代理ip ,并整理格式def getProxyHtml(self):
#        抓去代理 ip页面的代码page = urllib.urlopen(PROXYIPURL)html = page.read()#print htmlreturn htmldef ipPortRe(self):
#       从页面代码中取出代理 ip和端口html = self.getProxyHtml()#ip_re = re.compile(r'(((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?))')ip_re = re.compile(r'(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}).+\n.+>(\d{1,5})<')ip_port = re.findall(ip_re,html)return ip_portdef proxyIP(self):
#       格式化输出代理 ip和端口ip_port = self.ipPortRe()
#       将代理 ip整理成['221.238.28.158:8081', '183.62.62.188:9999']格式        proxyIP = []for i in range(0,len(ip_port)):proxyIP.append(':'.join(ip_port[i]))   #       将代理 ip整理成[{'http': 'http://221.238.28.158:8081'}, {'http': 'http://183.62.62.188:9999'}]格式        proxy_list = []for i in range(0,len(proxyIP)):a0 = 'http://%s'%proxyIP[i]a1 = {'http':'%s'%a0}proxy_list.append(a1)return proxy_listdef getHtml(url):p = getProxyIP()proxy_list = p.proxyIP()proxy_ip =random.choice(proxy_list) #在proxy_list中随机取一个ipprint proxy_ip    proxy_support = urllib2.ProxyHandler(proxy_ip)opener = urllib2.build_opener(proxy_support,urllib2.HTTPHandler)urllib2.install_opener(opener)request = urllib2.Request(url)user_agent = random.choice(user_agents.user_agents)  #在user_agents中随机取一个做user_agentrequest.add_header('User-Agent',user_agent) #修改user-Agent字段print user_agenthtml = urllib2.urlopen(request).read()print proxy_ipreturn proxy_ipURLS = ['http://www.x'x'xxw.net/study.asp?vip=','http://www.x'x'x'x'x'x.com/?fromuid=16',
        ]count_True,count_False,count= 0,0,0
while True:for url in URLS:count +=1try:proxy_ip=getHtml(url)            except urllib2.URLError:#print 'URLError! The bad proxy is %s' %proxy_ipcount_False += 1except urllib2.HTTPError:#print 'HTTPError! The bad proxy is %s' %proxy_ipcount_False += 1except:#print 'Unknown Errors! The bad proxy is %s ' %proxy_ip count_False += 1randomTime = random.uniform(1,3) #取1-10之间的随机浮点数time.sleep(randomTime) #随机等待时间print '%d Eroors,%d ok,总数 %d' %(count_False,count - count_False,count)

 1 #!/usr/bin/python
 2 #-*- coding:utf-8 -*-
 3 '''
 4 Created on 2013-7-14
 5
 6 @author: Administrator
 7 '''
 8
 9 user_agents = [
10     'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11',
11     'Opera/9.25 (Windows NT 5.1; U; en)',
12     'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)',
13     'Mozilla/5.0 (compatible; Konqueror/3.5; Linux) KHTML/3.5.5 (like Gecko) (Kubuntu)',
14     'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.0.12) Gecko/20070731 Ubuntu/dapper-security Firefox/1.5.0.12',
15     'Lynx/2.8.5rel.1 libwww-FM/2.14 SSL-MM/1.4.1 GNUTLS/1.2.9'
16 ]

View Code

转载于:https://www.cnblogs.com/chenjingyi/p/5794712.html

通过代理刷网页点击量相关推荐

  1. 代理刷网页点击量-点到为止 2014-03-11 09:40

    之前在oschina上看到一个用python写的 代理刷网页点击量 ,最近学习了下Python的基本语法,仔细研读了下代码, "代码主要实现网页的点击量,除了实现次功能点外,还有三个知识点: ...

  2. python通过代理刷网页点击量

    更新异常处理情况 @time 2013-0803 更新循环里计数问题和随机等待时间问题 #!/usr/bin/python #-*- coding:utf-8 -*- ''' 此脚本主要实现网页的点击 ...

  3. 刷微信点击量的php,微信刷文章点击量软件使用的方法是什么?

    所有的微信公众号管理员都会希望自己的微信公众号文章点击量高,因为点击量一高,文章的价值就会得到提升,相应的收入就会增加哦!所以都会去使用微信刷文章点击量软件,应该怎么使用呢? 微信刷文章点击量软件使用 ...

  4. web实现统计网页点击量

    web实现统计网页点击量 下面是我写的网页HTML文件 源代码Hello world: package runoob; import java.io.*; import javax.servlet.* ...

  5. 刷微信点击量的php,PHP一键刷QQ微信支付宝步数代码

    PHP一键刷QQ微信支付宝步数代码,账号密码步数填好直接地址栏回车,想要自动刷就设定计划任务.每天自动刷,步数不要太多,容易封运动,导致步数别人看不到! 使用说明:http://域名/?mobile= ...

  6. 用python刷网页浏览量_如何用python 增加网站点击量?

    简单一句话:就是调用你的浏览器,然后程序自动帮你打开你的网页,隔一段时间自动关闭.之后的步骤就是循环,刷访问量.下面看一篇文章: python3爬虫之访问量.点击率数据的爬取分析 1.明确问题: 通过 ...

  7. python广告刷量_Python一日一练05----怒刷点击量

    功能 自己主动获取CSDN文章列表,并对每篇文章添加点击量. 源代码 import urllib.request import re import time import random from bs ...

  8. python 编程一日一练-Python一日一练05----怒刷点击量

    功能 自己主动获取CSDN文章列表,并对每篇文章添加点击量. 源代码 import urllib.request import re import time import random from bs ...

  9. 流量互点PHP源码,点击量软件-求一个网页可以增加流量的软件?要释放。 。 。自由...

    求一个网页可以增加流量的软件?要释放. . .自由. 点击量软件好吧,我告诉你,流量是不同的IP地址缓存清理可以 建议您使用下无敌点击软件上的狗,它可以提高页面点击数"无敌点击狗" ...

最新文章

  1. c语言获取指针分配的字节数,c语言指针知识点总结(共6篇).docx
  2. Word VSTO Error:Interop type 'Microsoft.Office.Interop.OneNote.Application' cannot be embedded...
  3. linux read命令用法
  4. ASP.NET十分有用的页面间传值方法(转)
  5. HBase phoenix二级索引
  6. Shoutem旨在成为React Native移动应用领域的WordPress
  7. 活期储蓄账目管理系统
  8. linux可用机场客户端,Linux系统可用的6款Bittorrent客户端
  9. 卡卡半智能扫地机器人_扫地机器人哪个牌子好?精选五款高智能的扫地机器人...
  10. 基于改进的残差网络的指纹识别算法
  11. 平衡小车——编码器原理及其使用
  12. 在非关联情况下的欧姆定律的使用
  13. 一个有趣的二维码生成库Qart
  14. 小明左手拿着纸牌黑桃10,右手拿着纸牌红桃8, 现在交换手中的牌, 用程序模拟实现的过程, 并输出交换前后手中的纸牌的结果
  15. 图像修复(拖影、失焦、雨雾、模糊)deblurGAN 论文解读
  16. pageadmin CMS网站建设教程:站点的添加和管理
  17. can‘t decrement vector iterator before begin
  18. 快递鸟智选物流API对接流程
  19. Java-多线程讲解(2)
  20. python tkinter 随机抽奖程序

热门文章

  1. mysql服务器端按照显示无权限安装_菜鸟完整配置服务器 流程及权限设置
  2. Windows10下修改IP和MAC方法
  3. Android Studio 简要实现蓝牙(Bluetooth)通信(附加作业)
  4. 小米商城项目分析(上)
  5. Java、JSP社区蔬菜、食品交易平台
  6. 应用详情界面不允许“DISABLE“
  7. 操作系统学习初步--用GNU汇编创建最简单的OS
  8. 微信小程序电影票售票系统设计与实现
  9. 向日葵服务器的作用,向日葵客户端在服务器使用问题
  10. 投研报告 -用DEX技术链改投注网站的项目Betswap($BSGG)