python爬取国内代理ip_Python语言爬取代理IP
本文主要向大家介绍了Python语言爬取代理IP,通过具体的内容向大家展示,希望对大家学习Python语言有所帮助。
#!/usr/bin/env python
#-*-coding=utf-8 -*-
#AUTHOR:duwentao
import requests
import re
i = input("请输入你要爬取第几页:")
url = "https://www.kuaidaili.com/free/inha/" + i +"/"
print("获取代理IP地址")
header = {
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36
(KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr
1.0"
}
reponse = requests.get(url,header)
reponse.encoding='utf-8'
html = reponse.text
#p
= r'
(.*?)
data-title="PORT">(.*?)
data-title="匿名度">(.*?)
data-title="类型">(.*?)
data-title="位置">(.*?)
data-title="响应速度">(.*?)
data-title="最后验证时间">(.*?)
'
ip = r'
(.*?)'
IP = re.findall(ip,html,re.M|re.S)
dk = r'
(.*?)'
DK = re.findall(dk,html,re.M|re.S)
f=open("ip_list.txt","a")
for ip in IP:
IP_LIST = ip + ":" + DK[IP.index(ip)] + "\n"
f.write(IP_LIST)
f.close()
print("保存完毕")
本文由职坐标整理并发布,希望对同学们学习Python有所帮助,更多内容请关注职坐标编程语言Python频道!
python爬取国内代理ip_Python语言爬取代理IP相关推荐
- 取石头游戏 c语言,[HNOI2010]取石头游戏(博弈论+贪心)
题目描述: 有\\(n\\)堆石子,每堆石子的个数为\\(a_i\\),保证存在至少一堆石子个数为\\(0\\) 两个人,每个人每次可以取一堆石子,一堆石子可以被取当且仅当它相邻的石子有至少一堆为\\ ...
- 轮流取石子游戏c语言答案,取石子游戏
取石子游戏 取石子游戏 描述 输入 输出 输入样例 1 输出样例 1 思路 取石子游戏I 描述 输入 输出 输入样例 1 输出样例 1 取石子游戏II 描述 输入 输出 输入样例 1 输出样例 1 思 ...
- python爬虫代理ip_Python爬虫如何获取代理ip及ip验证?
如何获取大量的公开数据信息,这是我们互联网在竞争激烈的环境中的生存之道,不管在什么环境下都要学习和了解用户市场,客户需求,竞争对手,如何能获取到大量的数据信息,那么就需要用到网络爬虫. 在我们从事py ...
- python爬虫使用代理ip_python爬虫如何设置代理ip
python爬虫设置代理ip的方法:首先写入获取到的ip地址到proxy:然后用百度检测ip代理是否成功,并请求网页传的参数:最后发送get请求,并获取返回页面保存到本地. [相关学习推荐:pytho ...
- pythonrequests代理ip_python使用requests模块使用ip代理池
import json import telnetlib import requests import random # 代理ip列表 proxy_url = "https://raw.gi ...
- python实现ping某一ip_Python:如何ping一系列IP地址?
我想在Python中ping一系列IP地址并打印: "IP可访问,包丢失率为X%"或 "IP无法访问,包丢失X%" 我想尝试的范围是192.168.0.X,X是 ...
- [python学习] 简单爬取维基百科程序语言消息盒
文章主要讲述如何通过Python爬取维基百科的消息盒(Infobox),主要是通过正则表达式和urllib实现:后面的文章可能会讲述通过BeautifulSoup实现爬取网页知识.由于这方面的文章还是 ...
- python爬虫百度地图_零基础掌握百度地图兴趣点获取POI爬虫(python语言爬取)(基础篇)...
实现目的:爬取昆明市范围内的全部中学数据,包括名称.坐标. 先进入基础篇,本篇主要讲原理方面,并实现步骤分解,为python代码编写打基础. 因为是0基础开始,所以讲得会比较详细. 如实现目的所讲,爬 ...
- Python,requests爬虫,使用代理爬取大众点评(含爬取结果。。。在文末)
由于在工作中,客户需要大众点评的行业数据,因此本人使用Python对大众点评网站进行了爬取,虽然在爬取之前就想好了可能会遇到的坑,但是没想要从坑中爬出来这么难.本次大众点评爬虫代码编写耗时一个月.也算 ...
最新文章
- [Hadoop] Error: JAVA_HOME is not set
- python3.6.2安装教程-CentOS 7.2下安装Python 3.6.2
- Django数据库的查看、删除,创建多张表并建立表之间关系
- 从零入门 Serverless | 一文详解 Serverless 架构模式
- 【2019浙江省赛 - K 】Strings in the Pocket(马拉车,思维)
- ubuntu16.04 + kinetic +turtlebot2配置
- sin18度用计算机怎么算,sin18度等于多少怎么计算?谢谢
- T SQL + 正则表达式
- 46. Permutations 1
- 矩池云利用ipykernel为JupyterLab添加kernel以及展示出来
- proxy_cache的使用
- MTK:文件操作接口详解
- Serv-U和win2003防火墙的设置
- 3mx转osgb_OSGB格式的三维倾斜摄影文件转化成ARCGIS栅格文件
- 三极管实现与门、或门和非门操作
- week15 作业哈希算法
- 戴尔电脑如何设置快速开机
- 手写文字图片识别怎么弄?这几款软件安利快收好
- python 今日头条增加流量_今日头条怎么提高推荐量?
- 长谈:关于 View Measure 测量机制,让我一次把话说完
热门文章
- qmediaplayer获取流类型_Android MediaPlayer类详解
- mysql取最大一条数据,mysql取出表中,某字段值最大的一条纪录,sql语句
- 戴尔win10插耳机还外放_通州附近戴尔笔记本电脑维修哪家强-北京信维佳业科技有限公司...
- mate30pro 优化 开发者选项_10 个开发者必知的 MySQL 8.0 新功能
- cad java_cad和java哪个工资高
- wxpython收费吗_wxPython 使用总结
- cacti linux cpu datasource,Cacti监控Cisco CPU 以及内存
- 工具栏自定义_EXCEL LESSON12 自定义功能区菜单及工具栏(1/3)
- Vue跨路由触发事件,Vue监听sessionStorage
- 20179214《网络攻防实践》第二周学习总结