代理IP通过https://www.xicidaili.com/wn/ 获取,我使用的的是https 协议的代理。根据自己需求选择http或者https 协议的页面。废话不多说,直接上代码。

# -*- coding:utf-8 -*-
#from urllib import  request
import requests
import random
import time
import re
import threading
user_agent_list=['Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36','Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50','Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0)','Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1','Opera/9.80 (Windows NT 6.1; U; en) Presto/2.8.131 Version/11.11','Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11','Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SE 2.X MetaSr 1.0; SE 2.X MetaSr 1.0; .NET CLR 2.0.50727; SE 2.X MetaSr 1.0)','Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0','Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1',
]
count=0
def Get_proxy_ip():headers = {'Host': "www.xicidaili.com",'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36','Accept': r'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3'}req=requests.get(r'https://www.xicidaili.com/wt/',headers=headers)html=req.text
#print  (html)proxy_list=[]IP_list=re.findall(r'\d+\.\d+\.\d+\.\d+',html)port_lits=re.findall(r'<td>\d+</td>',html)for  i in range(len(IP_list)):ip=IP_list[i]port=re.sub(r'<td>|</td>','',port_lits[i])proxy='%s:%s' %(ip,port)proxy_list.append(proxy)return proxy_list
def Proxy_read(proxy_list,user_agent_list,i):proxy_ip=proxy_list[i]print ('当前代理ip:%s'%proxy_ip)user_agent = random.choice(user_agent_list)print('当前代理user_agent:%s'%user_agent)sleep_time = random.randint(5,15)print('等待时间:%s s' %sleep_time)time.sleep(sleep_time)print('开始获取')headers = {'User-Agent': user_agent}proxies={'http': proxy_ip}###########随机取列表中链接#############################################Url=['https://blog.csdn.net/qq_42409788/article/details/95076264','https://blog.csdn.net/qq_42409788/article/details/93755352',]url=random.choice(Url)  #随机读取链接try:req = requests.get(url, headers=headers,proxies=proxies, timeout=5)html=req.textprint (html)except Exception as e:print('******打开失败!******')else:global countcount += 1print('OK!总计成功%s次!' % count)if __name__ == '__main__':proxy_list = Get_proxy_ip()for i in range(100):Proxy_read(proxy_list, user_agent_list, i)

Python 刷访问量相关推荐

  1. python刷取CSDN博文访问量之一

    python刷取CSDN博文访问量之一 作者:vpoet 注:这个系列我只贴代码,代码不注释.有兴趣的自己读读就懂了,纯属娱乐,望管理员抬手 若有转载一定不要注明来源 1 #coding=utf-8 ...

  2. python刷今日头条访问量_Python 自动刷博客浏览量实例代码

    怎么利用python爬取csdn博客访问量例子 如何使用python来爬取自己博客访问量承认吧,小编们都是在深夜里崩溃的俗人.晚安,世界. 博客网站上有访问量这个记录么 如果有就可以抓取网站下来,正则 ...

  3. python爬虫设计刷博客访问量(刷访问量,赞,爬取图片)

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 需要准备 ...

  4. 【Python爬虫】写个爬虫爬取自己的博客,可以刷访问量

    预备工作 添加外部包: pip install bs4 pip install requests pip install virtualenv(这个好像没有必要) pip install lxml 第 ...

  5. 用python刷网页浏览量_如何用python 增加网站点击量?

    简单一句话:就是调用你的浏览器,然后程序自动帮你打开你的网页,隔一段时间自动关闭.之后的步骤就是循环,刷访问量.下面看一篇文章: python3爬虫之访问量.点击率数据的爬取分析 1.明确问题: 通过 ...

  6. 【Python3.6爬虫学习记录】(十一)使用代理IP及用多线程测试IP可用性--刷访问量

    前言:本来准备写一个刷空间留言的脚本,然而kb TX,无限循环空间验证码.上午还傻x的学验证码识别,后来才发现根本发不了留言,即使填的是对的,仍然继续弹出.无奈,睡了一觉,开始搞新玩意–代理IP!其实 ...

  7. python刷题软件代码_Python使用docx模块实现刷题功能代码

    起由: 前一阵子想要刷一刷国二Python的题库,千方百计找到题库之后,打开一个个word文档,发现一题一题阅读很麻烦,而且答案就在题目的下面,阅读题目的时候想自己做出题目却又总能不经意看到答案,甚烦 ...

  8. python刷leetcode_零基础python刷leetcode -- 3. Longest Substring Without Repeating Characters

    算法很重要,但是每天也需要学学python,于是就想用python刷leetcode 的算法题,和我一起开始零基础python刷leetcode之旅吧.如有不对的地方,希望指正,万分感谢~~ 题目 最 ...

  9. Python 刷题常用语法与数据结构汇总-2022.01.30

    [笔试]python刷题笔记(基础)! https://blog.csdn.net/a_123456598/article/details/105420802 python语法刷题 https://b ...

  10. python刷leetcode_零基础python刷leetcode -- 1. Two Sum

    算法很重要,但是每天也需要学学python,于是就想用python刷leetcode 的算法题,从第一题开始,从简单题开始零基础python刷leetcode之旅. Two Sum 首先过一下pyth ...

最新文章

  1. 拆解交易系统--模块拆解与服务化
  2. CNS接连发文背书,原来生姜这么神奇
  3. Debian/Ubuntu/Raspbian 时间同步
  4. 组合求解器 + 深度学习 =?这篇ICLR 2020论文告诉你答案
  5. vue-cli构建的vue项目中引入stylus文件
  6. linux上怎么修改hostname
  7. 变量和简单数据类型(一)
  8. 调研了10家公司的技术架构,我总结出了一套大数据平台的套路
  9. python字典的基本操作编程_Python入门教程5. 字典基本操作【定义、运算、常用函数】 原创...
  10. linux+git登陆,图解如何在Linux上配置git自动登陆验证
  11. [个人笔记]C# 基础语法
  12. 世界黑客编程大赛第一名的作品(97年Mekka ’97 4K Intro比赛)
  13. 操作系统——四种进程调度算法模拟实现(C语言)
  14. Qt信号和槽机制详解
  15. 2022年R2移动式压力容器充装特种作业证考试题库及在线模拟考试
  16. 前馈神经网络练习:使用tensorflow进行葡萄酒种类识别
  17. Fabric 1.0源代码分析(39) policy(背书策略)
  18. 洛谷P2178 [NOI2015]品酒大会 后缀数组+单调栈
  19. Respones请求重定向
  20. redis IO模型的演进

热门文章

  1. .axf文件_MDK 的编译过程及文件类型全解(一)
  2. python绘制1:1对角线(1:1 line)
  3. 两表关联去重查询全部数据
  4. wps多出来的页面怎么办?wps怎么删除不要的页
  5. WORD图、表标号——题注
  6. 使用PPT扣图,去掉背景
  7. PHP开发erp功能模块,ERP基础知识之功能模块介绍
  8. zh-cn语言(文化)代码与国家地区对照表
  9. JS实现轮播图(一看就懂逻辑清晰)
  10. Electron.js指南——键盘快捷键