好用的免费代理池

  • **项目地址:https://github.com/lin423497786/ProxyPool.git**
  • 效果图
    • 运行项目
    • 使用

项目地址:https://github.com/lin423497786/ProxyPool.git

效果图

免费代理池,提供如下功能:

  • 定时抓取免费代理网站的代理信息, 可扩展。
  • 定时验证爬取下来的代理, 剔除不可用代理, 留下可用代理, 保证代理的可用性。
  • 提供api, 方便提取可用的代理。

运行项目

  • Python>=3.6
  • 下载代码:
git clone https://github.com/lin423497786/ProxyPool.git
cd ProxyPool
  • 安装依赖:
pip install -r requirements.txt
  • 更改配置:
# proxypool/setting.py 为项目配置文件
import logging# redis key
REDIS_KEY = 'proxies'# redis 服务器的地址
REDIS_HOST = '192.168.174.128'# redis服务器的监听端口
REDIS_PORT = 6379# 连接redis服务器所使用的密码
REDIS_PASSWORD = ''# api服务绑定的ip地址
API_HOST = '0.0.0.0'# api服务监听的端口
API_PORT = 9999
...
  • 启动项目:
python3 run.py

使用

  • Api

启动服务后, 默认会在 http://127.0.0.1:9999 开启api接口服务:

api method Description params
/ GET api介绍 None
/random/ GET 随机获取多个代理 可选参数:
max_delay 代理的最大延迟
min_success_count最小的连续检测成功次数,
连续检测成功次数越多代表代理越稳定
number代理个数,默认为1
/pop/ GET 随机获取并删除多个代理 可选参数:
max_delay 代理的最大延迟
min_success_count最小的连续检测成功次数,
连续检测成功次数越多代表代理越稳定
number代理个数,默认为1
/all/ GET 获取所有代理 None
/count/ GET 查看代理数量 None
/clear/ GET 删除所有代理 None
/delete/ GET 删除代理 proxy={PROTOCOL}://{IP}:{PORT}"
  • 示例
import requests# 获取一个随机代理
url = 'http://127.0.0.1:9999/random/'
requests.get(url)# 获取一个延时不超过1秒的代理
url = 'http://127.0.0.1:9999/random/?max_delay=1'
requests.get(url)# 获取5个延时不超过1秒的代理
url = 'http://127.0.0.1:9999/random/?max_delay=1&number=5'
requests.get(url)# 获取1个延时不超过1秒且连续检测成功4次的代理, 连续成功越多次代表代理越稳定
url = 'http://127.0.0.1:9999/random/?max_delay=1&number=1&min_success_count=4'
requests.get(url)

好用的免费代理池搭建相关推荐

  1. 技术分享:Proxy-Pool代理池搭建IP代理

    提示:本章内容仅供参考,不涉及实际使用. Proxy Pool代理池搭建 前言 一.环境准备 二.搭建过程 1.Redis数据库搭建 2.Proxy-Pool代理池搭建 总结 前言 本章内容仅供参考, ...

  2. python爬虫免费代理池_Python爬取免费代理搭建代理池

    我们在做爬虫的过程中经常会遇到这样的情况:最初爬虫正常运行,正常抓取数据,一切看起来都是那么美好,然而一杯茶的功夫可能就会出现错误,比如403Forbidden:这时候网页上可能会出现 "您 ...

  3. 免费代理池(proxy_pool)搭建教程

    简介: 让我们先了解一下proxy_pool这个项目:在我们写爬虫的时候,有时候会遇到限制IP访问速度的,这样就严重的影响了我们程序的运行,而想解决限制就不得不去使用代理,网上的代理价格不一,让许多老 ...

  4. python爬虫免费代理池_【Python3爬虫】教你怎么利用免费代理搭建代理池

    一.写在前面 有时候你的爬虫刚开始的时候可以正常运行,能够正常的爬取数据,但是过了一会,却出现了一个"403 Forbidden",或者是"您的IP访问频率太高" ...

  5. 如何维护一个1000 IP的免费代理池

    楔子 好友李博士要买房了, 前几天应邀帮他抓链家的数据分析下房价, 爬到一半遇到了验证码. 李博士的想法是每天把链家在售的二手房数据都抓一遍, 然后按照时间序列分析. 链家线上在交易的二手房数据大概有 ...

  6. asyncio+aiohttp异步免费代理池(已失效)

    asyncio+aiohttp异步代理池 程序已失效,因为免费代理可用率实在太低,就不维护了. 异步代理池 github地址 初级版本代理池 博客地址 经历了好几天时间,终于将asyncio初步了解, ...

  7. 免费代理池,在线公共ip池

    这些公共代理是完全免费提供的,不需要任何授权. 免费代理通常是开放的.流行的公共代理. 与私人代理不同,公共代理不需要注册或密码.事实上,它们是负责安装在计算机上的代理服务器并且不关心更改默认设置的系 ...

  8. 动态可维护ip代理池搭建(定时更新模块)

    动态可维护ip代理池(爬虫模块)继上一次的爬虫模块,我们先来优化一下并添加redis配置参数,参数配置以自身机器设定. import random import time import request ...

  9. Python 抓取 快代理、西刺代理 、西拉代理等等 构建免费代理池

    import reimport requests from lxml import etreeheaders = {"User-Agent": "Mozilla/5.0 ...

最新文章

  1. 微信小程序实现滑动翻页效果源码附效果图
  2. WF4B1 的有返回值的Activity,Bookmark,有返回值Bookmark
  3. java 反查域名_C段查询雏形之在Java中反查一个IP上的所有域名(旁站查询)
  4. java消费者模式_基于Java 生产者消费者模式(详细分析)
  5. html5响应式网站优势,响应式网站优势有哪些 真的利于排名优化么
  6. linux内核中的hook函数详解,linux内核中的hook函数详解
  7. 计算机桌面图标右上角出现双箭头符号,电脑桌面上的图标有小箭头怎么清除?...
  8. 大学十年(一个程序员的路程)(林锐博士)《1----9》【林锐的大学10年】
  9. 预付费系统中电费电价管理的分析与应用
  10. oracle存储过程文件在哪,Oracle存储过程读文件-Oracle
  11. html,css和js
  12. 面试中sql调优的几种方式_面试方式
  13. win7计算机任务栏颜色怎么,如何修改win7电脑下方任务栏的颜色?
  14. Pytorch——XLNet 预训练模型及命名实体识别
  15. 如何在Joomla中创建一个漂亮的单页网站
  16. mysql查询表中不重复数据
  17. Android 平台camera相关梳理
  18. 倍福TwinCAT(贝福Beckhoff)常见问题(FAQ)-人机界面快速入门 TC3
  19. android studio模拟器打不开
  20. 什么是wms仓储管理系统?

热门文章

  1. Unity 触发检测 碰撞检测
  2. 使用FileOutPutStream下载docx文件报文件已损坏解决
  3. 招商银行信用卡中心18秋招题解
  4. 基于SDR的智能反射面波束成形设计
  5. Paint the Roads UVALive - 2197
  6. # 公有云?私有云?混合云?多云?行业云?傻傻分不清楚(下篇)
  7. VMware-ovftool命令行部署与导出镜像
  8. 天大《应用统计学》大作业期末考核
  9. 巴菲特抄底台积电,透露出哪些信号?
  10. 台积电业绩惊人,但全球芯片行业衰退影响加剧,将加码中国市场