赶集网模拟登陆程序PHP
<?php
$url = "https://passport.ganji.com/login.php";
//这里改成你自己的账号和密码
$data ="login_username=itbuluoge&login_password=123456";$result = vpost($url,$data,'cookie');
echo request_url_data("http://www.ganji.com/vip/my_post_list.php");
function vpost($url,$data,$cookie){ // 模拟提交数据函数$curl = curl_init(); // 启动一个CURL会话curl_setopt($curl, CURLOPT_URL, $url); // 要访问的地址curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, 0); // 对认证证书来源的检查curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, 1); // 从证书中检查SSL加密算法是否存在curl_setopt($curl, CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']); // 模拟用户使用的浏览器curl_setopt($curl, CURLOPT_COOKIE, $cookie);curl_setopt($curl, CURLOPT_REFERER,'https://passport.ganji.com/login.php');// 设置Referercurl_setopt($curl, CURLOPT_POST, 1); // 发送一个常规的Post请求curl_setopt($curl, CURLOPT_POSTFIELDS, $data); // Post提交的数据包curl_setopt($curl, CURLOPT_TIMEOUT, 30); // 设置超时限制防止死循环curl_setopt($curl, CURLOPT_HEADER, 0); // 显示返回的Header区域内容curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); // 获取的信息以文件流的形式返回//设置文件读取并提交的cookie路径curl_setopt($curl, CURLOPT_COOKIEJAR, 'cookie.txt '); //保存$tmpInfo = curl_exec($curl); // 执行操作if (curl_errno($curl)) {echo 'Errno'.curl_error($curl);//捕抓异常}curl_close($curl); // 关闭CURL会话return $tmpInfo; // 返回数据
}
function request_url_data($url)
{//初始化,创建一个新cURL资源$ch = curl_init();//读取cookiecurl_setopt($ch, CURLOPT_COOKIEFILE, 'cookie.txt ');//设置URL和相应的选项curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_HEADER, 0);//抓取URL并把它传递给浏览器$data=curl_exec($ch);//关闭cURL资源,并且释放系统资源curl_close($ch);
}
?>
注意需要修改成自己可用的账号和密码,我上面写的测试的一个无效账号,核心是采用了PHP的curl模拟登陆。
IT部落格(http://www.itbuluoge.com)-快乐快速学习,专注于免费编程教程,在线编程,IT面试笔记,IT面试经验
赶集网模拟登陆程序PHP相关推荐
- 【2019.06.22】12306官网模拟登陆之验证码生成与验证初探
前言 每一个学习过爬虫的人对12306肯定都是有点想法,但在每年春节或一些假期经历过12306官网抢票后,这些念头便逐渐不剩下多少了.有时候真的是活生生的人都瞅不出来 一直没有勇气去分析一下12306 ...
- 爬虫01-人人网模拟登陆
import requests ''' 利用requests的session保持回话,访问那些必须登陆后才能访问的网站 缺点:账号密码的提交action必须能够找到 ''' session = req ...
- 爬取摄图网里的 音乐和视频 摄图网模拟登陆
#首席那安装selinium from selenium import webdriver import time from lxml import etree import json #添加显示等待 ...
- requests模拟登陆 + 验证码
requests模拟登陆 + 验证码 文章目录 @[toc] 1.requests的高级应用 ~ 会话维持 2.打码平台 3.云打码平台接口使用 4.动态传参与模拟登陆 昨日回顾: 多线程爬虫: ...
- requests模拟登陆 验证码
文章目录 1.requests的高级应用 ~ 会话维持 2.打码平台 3.云打码平台接口使用 4.隐藏参数与模拟登陆 1.requests的高级应用 ~ 会话维持 # 利用Session对象发送get ...
- 网络爬虫模拟登陆获取数据并解析实战(二)
本文为原创博客,仅供学习使用.未经本人允许禁止复制下来,上传到百度文库等平台. 目录 分析要获取的数据 程序的结构 构建封装数据的model 模拟登陆程序并解析数据 结果展示 分析要获取的数据 下面继 ...
- 网络爬虫中的模拟登陆获取数据(实例教学1)
目录 模拟登陆的原因 如何模拟登陆 实战(demo) 模拟登陆的原因 很多网站,我们是无法直接获得服务器返回的数据,需要输入用户名及密码才能看到数据.如我们登陆人人网时,网站网址http://www. ...
- 淘宝爬虫实战---requests库实现模拟登陆模块
淘宝网---爬虫 (一).requests库实现淘宝网模拟登陆 最近想要写一个淘宝网的爬虫,具备模拟登陆.代理IP池.根据关键词爬取搜索页面商品数据,第一个目标就是淘宝的模拟登陆,不得不说,淘宝的用户 ...
- 以豆瓣网为例,模拟登陆爬虫以及验证码处理
在利用scrapy框架爬各种网站时,一定会碰到某些网站是需要登录才能获取信息. 最近在学天善智能课堂韦玮老师的课程,python数据挖掘与分析实战 ,通过自己部分的代码和借鉴老师的项目,多次试验改进调 ...
最新文章
- mysql查询错误_一个奇怪的MySQL查询错误
- [FPGA]基于FPGA的数字跑表
- python输入的数字为什么不能计算_计算器为什么只能进行个位数的计算,每次只能输入一个数字,求...
- Python精简入门学习(四)
- 今天终于可以正常下班了
- matlab 拖动曲线,Matlab屏幕交互取点并作三次样条曲线matlab GUI:屏幕取点+三次样条曲线+屏幕拖动 | 学步园...
- 营业执照吊销后,股权何去何从?
- 1423. 可获得的最大点数
- 多电压等级计算机潮流计算,电力系统稳态分析教学心得
- 百家讲坛之评说《资治通鉴》之探寻历史的密码
- pytorch_geometric(pyg)复现T-GCN
- npm run dev命令报错解决方式
- 扫地机器人朋友圈文案_匠龙扫地机器人广告片创意脚本文案
- 如何排版 微信公众号「代码块」之 MarkEditor
- Pandas基础入门知识点总结
- 新浪微博和腾讯微博图标
- 通过STM32CUBEMX生成RTOS系统运用(一)
- 基于自抗扰控制ADRC的主动悬架控制
- 智能泥石流泥水位监测预警系统解决方案
- 阿里云服务器和独享云虚拟主机有什么区别?应该如何选择?
热门文章
- SQL排序问题 (为空时排在前面)
- 实验三 熟悉Dataframe和Series数据结构
- 《蜗居》告诉你如何发展你的小三——宋思明海藻的故事
- HTML表格的基本样式作业
- Actipro WPF Studio语法编辑器和停靠控件
- 怎么调出全局搜索_以前需要找手机里的某个软件的时候欢太科技运营全局搜索功能强大...
- MATLAB环境下利用Liblinear工具箱实现Logistic Regression
- MySQL删除表数据 MySQL清空表数据命令 3种方法
- const setfill setw
- 利用ajax获取数据对学生表进行简单的增删改查