代理IP的简单应用

一、代理IP获取

代理IP一般有两种方式获取:
1、代理网站上的免费公用IP
这一步就是通过爬取大量网上的公用IP,建立一个初步的代理IP池,因为是免费的,所以很多IP都不能用,所以要做一个筛查的功能,就是通过访问指定网页,来看返回的网页状态码是否成功。

2、购买
私密代理12元1000个一天,每个IP平均存活时长1~5分钟

Source Code


import requests
# 目标网址
target_url = ['***']# 每次只提取一个IP
for i in range(1000):try:api_url = "http://dps.kdlapi.com/api/getdps?orderid=908816899692073&num=1&signature=1s0koqizcza7lmb8netrhwnyci2fedj8&pt=1&showtype=1"proxy_ip = requests.get(api_url)ip_host = str(proxy_ip.content).split("'")[1]print(ip_host)username = "********"#你的用户名password = "********"#你的密码proxies = {"http": "http://{}:{}@{}/".format(username, password, ip_host),"https": "https://{}:{}@{}/".format(username, password, ip_host)}headers = {"Accept-Encoding": "Gzip", }while True:for url in target_url:r = requests.get(url,proxies=proxies, headers=headers, timeout = 3) #print('【{}】【{}】'.format(i, target_url.index(url)),r.status_code)except:continue

【Python爬虫】:代理IP的使用 提升访问量相关推荐

  1. python 代理ip池_GitHub - xuan525/proxy_pool: Python爬虫代理IP池(proxy pool)

    ProxyPool 爬虫代理IP池 ______ ______ _ | ___ \_ | ___ \ | | | |_/ / \__ __ __ _ __ _ | |_/ /___ ___ | | | ...

  2. python 爬虫工具 butter_GitHub - TheButterflyOdor/proxy_pool: Python爬虫代理IP池(proxy pool)

    爬虫IP代理池 ______ ______ _ | ___ \_ | ___ \ | | | |_/ / \__ __ __ _ __ _ | |_/ /___ ___ | | | __/| _// ...

  3. Python爬虫 | 代理IP的获取和使用

    GiThub项目地址:https://github.com/xylon666/Proxy_IP 在使用爬虫大规模爬取网站信息时,有时会遇到反爬虫策略,比如当网站检测到一个IP地址频繁访问时,就会默认其 ...

  4. Python爬虫代理ip异常和超时解决方案

    Python爬虫中的代理ip异常和超时如何解决?程序员在敲代码的过程中,一定会出现一定的错误,特别是像Python爬虫这种程序,并不能肯定每次请求都能保障稳定的返回同样的结果,例如反爬虫机制的强化,代 ...

  5. Python爬虫-代理ip池建立

    代理IP池建立 前言 之前提到过urllib和requests的利用代理ip的访问方式 . https://blog.csdn.net/zhouchen1998/article/details/813 ...

  6. python爬虫——代理IP

    代理:破解封IP这种反爬机制. 什么是代理: 代理服务器. 代理的作用: 突破自身IP访问的限制. 隐藏自身真实IP 代理相关的网站: - 快代理 西祠代理 www.goubanjia.com htt ...

  7. python爬虫 - 代理ip正确使用方法

    主要内容:代理ip使用原理,怎么在自己的爬虫里设置代理ip,怎么知道代理ip是否生效,没生效的话哪里出了问题,个人使用的代理ip(付费). 目录 代理ip原理 输入网址后发生了什么呢? 代理ip做了什 ...

  8. 关于python爬虫代理ip设置proxies的问题

    本人在学习爬虫的过程中学习如何设置代理ip,但是遇到了request请求中proxies参数编写的问题 首先必须知道proxies参数是一个字典类型 proxies={ 'http': 'http:/ ...

  9. Python爬虫代理IP的使用

    做测试前需要先获取一个可用的代理,搜索引擎搜索"代理"关键字,就可以看到很多代理服务网站,会有很多免费代理可以使用,推荐www.xicidaili.com,以下是自动获取西刺代理网 ...

最新文章

  1. Python 字符串操作
  2. python实现md5加密_Python实现md5加密验证访问接口总结
  3. Supercomputer 解题报告
  4. java rsa 117_java实现RSA非对称加密解密
  5. HDU 4359 Easy Tree DP? 组合数学+动归
  6. ImageRanger 全萤幕检视操作说明
  7. 如何在HTML中使用JavaScript代码
  8. eclisp导入jsp项目之基础
  9. 简单c语言图形程序设计,c语言简单图形编程
  10. coreldraw2019天气滤镜_CorelDRAW2019快捷键大全
  11. 小程序常见授权失败原因和解决办法
  12. windows 无法停止ics_Windows10系统不能启动ICS服务致无法连接WiFi热点的三种解决方法...
  13. FreeMind 思维导图的使用
  14. 摄氏度符号英文计算机语言,英文摄氏度°C符号的正确输法
  15. JSP界面——背景图片
  16. Ubuntu 22.04 桌面美化之Mac Big Sur风格
  17. #displaytag:一个简易的Java分页插件(无需其他的前端分页插件) @FDDLC
  18. request.setAttribute()的用法
  19. 《opencv学习笔记》-- 亚像素角点检测
  20. 消息中间件系列 - RabbitMQ

热门文章

  1. Python3 抓取网页小说
  2. GitHub Desktop使用说明(2)快捷键
  3. 动态内存与静态内存的区别
  4. CE工具实例:修改植物大战僵尸植物2
  5. 【情态动词练习题】had to 和 will have to
  6. 暗黑破坏神不朽传奇宝石共鸣方法攻略
  7. 环境类sci期刊排名一区_SCI计算机学术期刊排名(收藏对你有用)
  8. python输出一年有多少时间_python如何输出日期
  9. Camera模组详解
  10. python超越方程_matlab简单的超越方程求解近似值