Python 爬虫经常需要睡眠防止被封IP time sleep

###1.概率分布睡眠 使用正态分布模拟范围波动的时间,更真实 正态分布是一种连续型概率分布,在自然界中很常见,如身高、寿命、考试成绩等,属于各种因素相加对结果的影响。

import time
import randomdef random_sleep(mu=1, sigma=0.4):'''正态分布随机睡眠:param mu: 平均值:param sigma: 标准差,决定波动范围'''secs = random.normalvariate(mu, sigma)if secs <= 0:secs = mu  # 太小则重置为平均值time.sleep(secs)

μ=1, σ=0.4 运行结果: 0.7064196787554182 1.2534987046066317 0.9947152762545793 0.6406594468142128 1.1230730100881552 1.3657589217334918 0.352417427623824 1.060297589921571 1.16466426576179 1.6256129468167888

###2.随机小数

import random
t = random.random() #随机大于0 且小于1 之间的小数
time.sleep(t)

结果: 0.9441832228391154

import random
t = random.uniform(0,9)   #随机一个大于0小于9的小数
time.sleep(t)

结果: 7.646583891572416

###3.随机整数

t = random.randint(1,5)  #随机一个大于等于1且小于等于5的整数
time.sleep(t)

结果: 5

t = random.randrange(1,10,2)  #随机一个大于等于1且小于等于10之间的奇数,其中2表示递增基数
time.sleep(t)

结果: 3

###4.循环输出休眠1秒

import time
i = 1
while i = 3:print(i) # 输出ii += 1time.sleep(1) # 休眠1秒

###5.循环输出休眠100毫秒

import time
i = 1
while i = 3:print(i) # 输出ii += 1time.sleep(0.1) # 休眠0.1秒

Python 爬虫经常需要睡眠防止被封IP time sleep相关推荐

  1. Python爬虫实战之:快代理搭建IP代理池(简版)

    目录 前言 项目背景 项目简介 前期准备 讲解1:项目搭建 讲解2:安装 faker 库获取user-agent 讲解3:分析 "快代理" 页面 讲解4:筛选有效IP 讲解5:Pa ...

  2. Python爬虫抓取数据时怎么防止ip被封

    大数据公司在做数据分析的时候,对目标网站频繁访问很容易触发网站的反爬机制,因此如果想要突破限制只能使用动态ip频繁切换地址模拟真实客户访问网站才能起到防封效果.比如在做数据抓取的时候报错403等限制访 ...

  3. Python爬虫批量访问突破访问限制封禁的方法

    坑述 数据采集常用的方法是写一个爬虫程序向网络服务器请求数据(通常是用HTML表单或其他网页文件),然后对数据进行解析,提取需要的信息. 然而 批量访问时会有访问限制 更会认为频繁访问是恶意攻击,对i ...

  4. Python爬虫方式抓取免费http代理IP

    我们新手在练手的时候,常常需要一些代理IP进行爬虫抓取,但是因为学习阶段,对IP质量要求不高,主要是弄懂原理,所以花钱购买爬虫代理IP就显得没必要(大款忽略),今天跟大家分享一下,如果使用爬虫抓取免费 ...

  5. 【python爬虫】在scrapy中利用代理IP(爬取BOSS直聘网)

    同学们好,我又滚回来更新了,这一次我们要爬取的目标是BOSS直聘,BOSS直聘可以说是反爬虫一个很好的例子了,主要在于如果你访问他的次数过多,他就会出现验证码,要求你通过验证才能继续看,这样还算可以, ...

  6. Python爬虫开发:requests库的使用--ip代理参数的设置

  7. (python爬虫时)如何知道是否代理ip伪装成功

    通过请求  http://httpbin.org/get   获得类似以下信息: {"args": {}, "headers": {"Accept&q ...

  8. Python爬虫9大入门学习知识点

    1.掌握Python编程能基础 想要学习爬虫,首先要充分掌握Python编程技术相关的基础知识.爬虫其实就是遵循一定的规则获取数据的过程,所以在学习Python知识的过程中一定要重点学习其中的数据类型 ...

  9. 如何自学python爬虫-怎样入门学习Python爬虫?

    怎样入门学习Python爬虫? 1.掌握Python编程能基础 想要学习爬虫,首先要充分掌握Python编程技术相关的基础知识.爬虫其实就是遵循一定的规则获取数据的过程,所以在学习Python知识的过 ...

  10. python爬虫反爬-python爬虫--爬虫与反爬

    爬虫与反爬 爬虫:自动获取网站数据的程序,关键是批量的获取. 反爬虫:使用技术手段防止爬虫程序的方法 误伤:反爬技术将普通用户识别为爬虫,从而限制其访问,如果误伤过高,反爬效果再好也不能使用(例如封i ...

最新文章

  1. nodejs中的全局函数setTimeout/clearTimeout,setInterval/clearInterval,unref/ref
  2. C++assert 断言
  3. 802.11n兼容a/b/g问题(Legacy mode,Mixed mode,Greenfield mode)
  4. python 3.5.2设计页面_怎么解决win10系统搭建Python 3.5.2开发环境的处理方案
  5. 【CodeForces - 507B】Amr and Pins(思维贪心,几何问题)
  6. 49 CO配置-控制-获利能力分析-把控制范围分配给经营范围
  7. android 开发传输安全,移动应用安全开发指南(Android)--数据传输
  8. iOS 之 Property List
  9. linux 交换机 进程,基于Linux系统交换机的进程升级研究
  10. GSM/GPRS MODEM 的上网设置
  11. 高数 吉米多维奇 785
  12. Python 实现定时任务
  13. 小白如何打造一个基础的留言板网站(二)
  14. 处理器后面的字母含义_笔记本处理器型号认识
  15. html会员积分模板,人人商城会员中心头部模板显隐会员积分等项 - YangJunwei
  16. 我为什么要离开传智再去创业?
  17. 多硬盘分区管理fdisk-张丹
  18. 如何成为一名合格的运筹优化算法工程师?
  19. axios跨域解决方案
  20. 九、系统的软中断导致CPU使用率升高,我该怎么办?

热门文章

  1. 初学Jmeter的摘抄学习总结----------基础知识篇
  2. 2017.3.20-morning
  3. js-权威指南学习笔记21
  4. 第五章 搭建开发板的测试环境
  5. [转载]taking photos with live image preview
  6. APS傻瓜教材读后感之为什么需要人机交互调度
  7. 碰撞域与广播域的区别
  8. 【python】中 type dtype astype辨析
  9. pandas 入门(详看注释)
  10. ArcGIS 视域分析