分两个服务:

一个是提供所有ip和随机ip,删除那些维护ip池功能的api服务。

参考:先搭建好代理池用http提供接口
http://www.spiderpy.cn/blog/detail/13
https://xz.aliyun.com/t/7718
https://github.com/jhao104/proxy_pool

一个是隧道ip池,写代码时就可以固定一个隧道ip代理。
参考:

然后通过squid来提供代理ip转发切换功能
https://blog.csdn.net/aaronjny/article/details/87865942
https://www.jianshu.com/p/130083146c8f
https://github.com/AaronJny/open_proxy_pool
如果systemctl start squid.service启动服务失败,用squid -k parse检查配置格式等问题,即使报ERROR: Ignoring unknown cache_peer option其实也是可以正常启动的
启动服务出现:Failed to make swap directory /var/spool/squid,就修改权限chown squid:squid /var/spool/squid
请求返回:ERROR:The requested URL could not be retrieved,可能是squid.conf里代理ip没配置好或无效
查看systemctl status squid.service启动情况,如果出现FATAL: ERROR: cache_peer 1.1.1.1 specified twice是配置多个代理条目,相同ip不同port报错,在cache_peer最后加上 name=proxy-90随机。参考https://www.cnblogs.com/my8100/p/7441501.html

https://xnathan.com/2017/03/02/squid-proxy-pool/
搭建ip池,使用 Squid 提供的父代理功能,自动将爬虫服务器的请求转发给代理服务器。Squid提供了自动轮询功能,自动验证并剔除不可用的代理。减少了我们多余的验证步骤。

请求获取代理,然后直接写入squid配置:https://github.com/xNathan/squid_proxy_pool

实测做的是,直接拿redis里ip配置到squid,使用的是这个项目:https://github.com/AaronJny/open_proxy_pool

Squid 就会自动检测每个代理的有效性
http://blog.itpub.net/31557738/viewspace-2679380/
squid做访问控制,就是一个ip均衡使用?

nginx也可以实现同样功能?

squid代理服务+ip代理池相关推荐

  1. 5 使用ip代理池爬取糗事百科

    从09年读本科开始学计算机以来,一直在迷茫中度过,很想学些东西,做些事情,却往往陷进一些技术细节而蹉跎时光.直到最近几个月,才明白程序员的意义并不是要搞清楚所有代码细节,而是要有更宏高的方向,要有更专 ...

  2. Python使用Redis实现IP代理池

    可以使用快代理,芝麻代理,蘑菇代理 ,讯代理等代理商提供API代理IP或者免费代理建立自己IP代理池 #使用apscheduler库定时爬取ip,定时检测ip删除ip,做了2层检测,第一层爬取后放入r ...

  3. python ip代理池_python实现ip代理池功能示例

    本文实例讲述了python实现ip代理池功能.分享给大家供大家参考,具体如下: 爬取的代理源为西刺代理. 用xpath解析页面 用telnet来验证ip是否可用 把有效的ip写入到本地txt中.当然也 ...

  4. 爬虫学习笔记(十)—— Scrapy框架(五):下载中间件、用户/IP代理池、settings文件

    一.下载中间件 下载中间件是一个用来hooks进Scrapy的request/response处理过程的框架. 它是一个轻量级的底层系统,用来全局修改scrapy的request和response. ...

  5. 开源IP代理池续——整体重构

    开源IP代理池 继上一篇开源项目IPProxys的使用之后,大家在github,我的公众号和博客上提出了很多建议.经过两周时间的努力,基本完成了开源IP代理池IPProxyPool的重构任务,业余时间 ...

  6. python通过ip池爬_python爬虫18 | 就算你被封了也能继续爬,使用IP代理池伪装你的IP地址,让IP飘一会...

    我们上次说了伪装头部 ↓ 让自己的 python 爬虫假装是浏览器 小帅b主要是想让你知道 在爬取网站的时候 要多的站在对方的角度想问题 其实 这和泡妞差不多 你要多站在妹纸的角度思考 她的兴趣是什么 ...

  7. python爬虫ip代理池_爬虫教程-Python3网络爬虫开发——IP代理池的维护

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 准备工作 要实现IP代理池我们首先需要成功安装好了 Redis 数据库并启动服务,另外还需要安装 Aiohttp.Requests.RedisPy.PyQ ...

  8. 【解决方案】IP代理池设计与解决方案

    [解决方案]IP代理池设计与解决方案 参考文章: (1)[解决方案]IP代理池设计与解决方案 (2)https://www.cnblogs.com/fonxian/p/10858127.html 备忘 ...

  9. Scrapy学习-13-使用DownloaderMiddleware设置IP代理池及IP变换

    设置IP代理池及IP变换方案 方案一: 使用国内免费的IP代理 1 http://www.xicidaili.com # 创建一个tools文件夹,新建一个py文件,用于获取代理IP和PORT fro ...

最新文章

  1. 链表问题19——合并两个有序的单链表
  2. MQTT---HiveMQ源代码具体解释(十八)Cluster-kryo与Serializer
  3. 二分查找和折半插入排序一块说说-很合适~~~
  4. 命运2服务器维护时间2019,《命运2》今晚将停机维护 为多平台共用存档做准备...
  5. bzoj3195 [Jxoi2012]奇怪的道路
  6. java esc的_如何用Java中的Receipt打印机和ESC / POS命令提高速度
  7. Java 8 新日期时间 API ( 下 ) – 时区日期时间
  8. ElasticSearch常用搜索关键字整理
  9. CTS测试中CameraTest#testPreviewFpsRange项
  10. Enable debug logging for this logger for a complete list of JARs that were scanned but no TLDs were
  11. 低调的大神!他改变了半导体产业!史上唯一两次获得诺贝尔物理奖,却几乎被人遗忘...
  12. 【ospf的三类LSA sum-net】(真假ABR、区域间防环机制、vlink)
  13. Quartus Primer 17.0 下载和安装
  14. 牛视系统怎么做矩阵?牛视系统源码怎么独立部署?
  15. 删除计算机的用户凭据,windows凭据怎么填写? 电脑添加删除Windows凭据的技巧
  16. 苹果:第三方安装软件或导致严重隐私、安全风险
  17. [数学建模]灵敏度分析记录
  18. Pintos project2 实验报告
  19. 超低延时监控视频多终端发布解决方案
  20. 物化--逍遥游 庄子南华(南怀瑾老师)

热门文章

  1. 信息化管理系统(制造业ERP系统)
  2. 计算机网络检查方式,一种计算机网络环路检测方法与流程
  3. 楼市回暖有赖于经济复苏
  4. QT程序退出后托盘图标不消失问题
  5. LPC1768之中断
  6. Infinite-former:无限记忆变换器
  7. python scrapy爬虫视频_python爬虫scrapy框架的梨视频案例解析
  8. 【java毕业设计】基于java+swing+Eclipse的推箱子游戏设计与实现(毕业论文+程序源码)——推箱子游戏
  9. 模拟量输入、输出应用举例
  10. linux上同步日历的,Linux命令行上如何使用日历详解