Python爬虫实现网页自动刷票

2024-04-09 18:03:16

Python爬虫实现网页自动刷票

获取目标目标本人此除随机选定目标为1号

目标网站投票地址
该活动是一个由网页设置的投票活动，所以在编写代码的时候会特别轻松，没有微信投票那样麻烦(open_id),API索取等一系列操作。

获取目标目标本人此除随机选定目标为1号

目标投票页面投票页面并通过本人ip地址等进行投票截取其提交数据

这里咋们用BurpSite进行数据截取

可以看出，此次提交请求目标为 Request URL: http://www.pandafoundation.com/e/public/digg/?classid=391&id=6849&dotop=1&doajax=1&ajaxarea=diggnum GET请求并不是传统的POST形式，GET模式相对来说就是单纯的一次请求，这里我改了一次浏览器的UA标识，再次提交，发现已经提交过了。

利用python Requests模块进行Get，打印其状态码，以及cookie信息，发现，该网站服务器有安装云锁。

yunsuo_session_verify=fd89a583829a5a3c2ede67e0d5a8b3ed

多次提交发现，cookie都是一样，说明是验证cookie的手段来判断同一用户

具体代码如下

import requests
import urllib
from fake_useragent import UserAgent
from urllib import request
from http import cookiejar
f=open("ip.txt","r")while True:for i in f:print("当前为"+i.strip())try:proxy = i.strip();print(proxy)proxies = {'http': 'http://' + proxy,}url = "http://www.pandafoundation.com/e/public/digg/?classid=391&id=6849&dotop=1&doajax=1&ajaxarea=diggnum"ua = UserAgent()headers = {'User-Agent': ua.random}r = requests.get(url=url, headers=headers, timeout=3,proxies=proxies)print(r.text)print(r.cookies)except :print("连接错误")

通过requests 模块进行GET请求会比urrlib模块简单很多

使用方法如下

r = requests.get(url="目标网址", headers="请求头", timeout=3,proxies="ip池")

通过while方法循环使用f文件打开模式，使用strip()函数可以实现循环遍历ip.txt文件内容。

from fake_useragent import UserAgent

模块为随机生成UA标识

 ua = UserAgent()headers = {'User-Agent': ua.random}

运行结果

Python爬虫实现网页自动刷票相关推荐

Python爬虫: 单网页所有静态网页动态网页爬取
Python爬虫: 单网页所有静态网页动态网页爬取前言:所有页代码主干均来自网上!!!感谢大佬们. 其实我对爬虫还挺感兴趣的,因为我玩instagram(需要科学上网),上过IG的人都知道IG虽 ...
python爬虫解决网页重定向问题
python爬虫解决网页重定向问题参考文章: (1)python爬虫解决网页重定向问题 (2)https://www.cnblogs.com/zhumengke/articles/9618368.h ...
python Chrome + selenium自动化测试与python爬虫获取网页数据
一.使用Python+selenium+Chrome 报错: selenium.common.exceptions.SessionNotCreatedException: Message: sessi ...
Python爬虫获取网页编码格式
Python爬虫获取网页编码格式网页编码格式是每个网页规定的本页面文字的编码方式,其中比较流行的是ascii, gbk, utf-8, iso等.观察许多网页的编码格式都是在meta标签的conte ...
[Python爬虫] Selenium实现自动登录163邮箱和Locating Elements介绍
前三篇文章介绍了安装过程和通过Selenium实现访问Firefox浏览器并自动搜索"Eastmount"关键字及截图的功能.而这篇文章主要简单介绍如何实现自动登录163邮箱,同时 ...
Python爬虫解析网页的4种方式值得收藏
用Python写爬虫工具在现在是一种司空见惯的事情,每个人都希望能够写一段程序去互联网上扒一点资料下来,用于数据分析或者干点别的事情. 我们知道,爬虫的原理无非是把目标网址的内容下载下来存储到内存中, ...
Python爬虫 Selenium实现自动登录163邮箱和Locating Elements介绍
Python爬虫视频教程零基础小白到scrapy爬虫高手-轻松入门 https://item.taobao.com/item.htm?spm=a1z38n.10677092.0.0.482434a6E ...
Python爬虫之网页采集器
文章目录前言一.爬虫是什么? 二.使用步骤 1.引入库 2.简单的页面爬取的四步流程 1.获取url 2.向url发送请求,并获取响应(需要http协议) 3.如果从响应中提取url,则继续发送请 ...
快速入门！Python爬虫，京东自动登录，在线抢购商品！
话不多少,今天教大家如何用Python爬虫,自动登录京东网站,查询商品库存,价格,显示购物车详情等.可以指定抢购商品,自动购买下单,然后手动去京东付款就行. 运行环境 Python 2.7 第三方库 ...
python爬虫新闻网页的浏览量转载量,Python爬取新闻网标题、日期、点击量
最近接触Python爬虫,以爬取学校新闻网新闻标题.日期.点击量为例,记录一下工作进度目前,感觉Python爬虫的过程无非两步: Step1.获取网页url(利用Python库函数import ur ...

最新文章

热门文章