以正方教务系统为例,用php模拟登陆抓取课表、空教室,抓取课表

课程格子和超级课程表这两个应用,想必大学生都很熟悉,使用自己的学号和教务系统的密码,就可以将自己的课表导入,随时随地都可以在手机上查看。

其实稍微了解一点php的话,我们也可以做一个类似这样的web 应用。

1,解决掉验证码

其实这是正方的一个小bug,当我们进入登陆界面时,浏览器会去请求服务器,服务器会生成一个验证码图片。如果我们不去请求这个图片,那么正方后台也不会生成相应的 验证码,于是这样我们就有了可乘之机,让我高兴会儿~这时,我们在不填写验证码的情况下,可以很流畅的进入。大家可以在自己的电脑上禁止访问验证码的地址,然后试试这 是不是真的~当然,这只对正方有效。

2,php 的curl 模拟登陆

这里直接贴一个脚本之家对 curl 的讲解吧 http://www.jb51.net/article/51299.htm

接下来就是相关代码了,相信很多人和我一样,只喜欢看例子,对于长篇大论的讲解,转头就走……不过这个习惯还是不好……废话不多说!

//模拟登陆

function curl_request($url,$post='',$cookie='', $returnCookie=0){

$curl = curl_init();

curl_setopt($curl, CURLOPT_URL, $url);

curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)');

curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);

curl_setopt($curl, CURLOPT_AUTOREFERER, 1);

curl_setopt($curl, CURLOPT_REFERER, "这里一定要换成教务系统登陆的url"); //填写教务系统url

if($post) {

curl_setopt($curl, CURLOPT_POST, 1);

curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post));

}

if($cookie) {

curl_setopt($curl, CURLOPT_COOKIE, $cookie);

}

curl_setopt($curl, CURLOPT_HEADER, $returnCookie);

curl_setopt($curl, CURLOPT_TIMEOUT, 20);

curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);

$data = curl_exec($curl);

if (curl_errno($curl)) {

return curl_error($curl);

}

curl_close($curl);

if($returnCookie){

list($header, $body) = explode("\r\n\r\n", $data, 2);

preg_match_all("/Set\-Cookie:([^;]*);/", $header, $matches);

$info['cookie'] = substr($matches[1][0], 1);

$info['content'] = $body;

return $info;

}else{

return $data;

}

}

3,教务系统登陆页面的隐藏字段

举个栗子

这些东西在登陆的时候也是需要带上的,顺便贴出函数,顺便暴漏了博主的学校……皇家种地大学(主要是正则表达式的运用)

//登陆页面的隐藏字段

function getView(){

$url = 'http://jw.hzau.edu.cn/default2.aspx';

$result = curl_request($url);

$pattern = '//is';

preg_match_all($pattern, $result, $matches);

$res[0] = $matches[1][0];

return $res[0] ;

}

//返回教室查询页面的隐藏值

private function getViewJs($cookie,$xh){

$url = "http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";

$result = curl_request($url,'',$cookie);

$pattern = '//is';

preg_match_all($pattern, $result, $matches);

$res[0] = $matches[1][0];

return $res[0] ;

}

4,cookie 的获取

function login($xh,$pwd){

$url = 'http://jw.hzau.edu.cn/default2.aspx';

$post['__VIEWSTATE'] = $this->getView();

$post['txtUserName'] = $xh; //填写学号

$post['TextBox2'] = $pwd; //填写密码

$post['txtSecretCode'] = '';

$post['lbLanguage'] = '';

$post['hidPdrs'] = '';

$post['hidsc'] = '';

$post['RadioButtonList1'] = iconv('utf-8', 'gb2312', '学生');

$post['Button1'] = iconv('utf-8', 'gb2312', '登录');

$result = curl_request($url,$post,'', 1);

return $result['cookie'];

}

5,让我们来试试查课表的功能,格式有点乱额,大家凑合着看,我把课表转成了一个二维关联数组

//返回课表字符串

private function classresult($xh,$pwd){

date_default_timezone_set("PRC"); //时区设置

$classList = "";//声明课表变量

$cookie = $this->login($xh,$pwd);

$view = $this->getViewJs($cookie,$xh);//验证密码是否正确

//如果密码正确

if (!empty($view)) {

$url = "http://jw.hzau.edu.cn/xskbcx.aspx?xh={$xh}";

$result = curl_request($url,'',$cookie); //保存的cookies

preg_match_all('/([\w\W]*?)/',$result,$out);

$table = $out[0][0]; //获取整个课表

preg_match_all('/([\w\W]*?)/',$table,$out);

$td = $out[1];

$length = count($td);

//获得课程列表

for ($i=0; $i < $length; $i++) {

$td[$i] = str_replace("

", "", $td[$i]);

$reg = "/{(.*)}/";

if (!preg_match_all($reg, $td[$i], $matches)) {

unset($td[$i]);

}

}

$td = array_values($td); //将课程列表数组重新索引

$tdLength = count($td);

for ($i=0; $i < $tdLength; $i++) {

$td[$i] = iconv('GB2312','UTF-8',$td[$i]);

}

//将课表转换成数组形式

function converttoTable($table){

$list = array(

'sun' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

),

'mon' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

),

'tues' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

),

'wed' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

),

'thur' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

),

'fri' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

),

'sat' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

)

);

$week = array("sun"=>"周日","mon"=>"周一","tues"=>"周二","wed"=>"周三","thur"=>"周四","fri"=>"周五","sat"=>"周六");

$order = array('1,2','3,4','5,6','7,8','9,10');

foreach ($table as $key => $value) {

$class = $value;

foreach ($week as $key => $weekDay) {

$pos = strpos($class,$weekDay);

// echo $pos;

if ($pos) {

$weekArrayDay = $key; //获取list数组中的第一维key

foreach ($order as $key => $orderClass) {

$pos = strpos($class,$orderClass);

if ($pos) {

$weekArrayOrder = $orderClass; //获取该课程是第几节

break;

}

}

break;

}

}

$list[$weekArrayDay][$weekArrayOrder] = $class;

}

return $list;

}

//调用函数

return converttoTable($td);

}else{

return 0;

}

}

6,再试试查询空教室的功能

//空教室查询结果

public function roomresult(){

$xh = ""; //设置学号

$pwd = ""; //学号对应的密码

$cookie = $this->login($xh,$pwd);

$url = "http://jw.hzau.edu.cn/xs_main.aspx?xh={$xh}";

$result = curl_request($url,'',$cookie); //保存的cookies

$url="http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";

$post['Button2'] = iconv('utf-8', 'gb2312', '空教室查询');

$post['__EVENTARGUMENT']='';

$post['__EVENTTARGET']='';

$post['__VIEWSTATE'] = $this->getViewJs($cookie,$xh);

$post['ddlDsz'] = iconv('utf-8', 'gb2312', '单');

$post['ddlSyXn'] = '2014-2015'; //学年

$post['ddlSyxq'] = '1';

$post['jslb'] = '';

$post['xiaoq'] = '';

$post['kssj']=$_GET['start']; //提交的开始查询时间

$post['sjd']=$_GET['class'];//提交的课程节次

$post['xn']='2014-2015';//所在学年

$post['xq']='2';//所在学期

$post['xqj']='6';//当天星期几

$post['dpDataGrid1:txtPageSize']=90;//每页显示条数

$result = curl_request($url,$post,$cookie,0);

preg_match_all('/

php正方系统抓取课表,以正方教务系统为例,用php模拟登陆抓取课表、空教室,抓取课表...相关推荐

  1. 服务器端配置正方教务系统,手把手带你打造一个教务系统客户端(附源码)

    本篇博客主要和大家分享编写一个学校教务系统的客户端版本,主要是关于登录以及数据获取方面,结尾还会附上本人以前编写的客户端源代码,有兴趣的可以自行下载玩耍~ 阅读本文大概需要5分钟. 前言 好久没有更新 ...

  2. 使用 PyRsa 库解决新版正方教务的 RSA 加密问题并模拟登陆的 Python 实现

    前言 先前有一个契机,需要模拟登陆学校所使用的正方教务来获取课程表,其所使用的 RSA 加密方法没有现成的 Python 库可使用,目前其他的 CSDN 博客所采用的方法均无法成功登陆,故只能自己研究 ...

  3. python成绩查询系统_Python爬虫实战:登录教务系统查成绩

    本文记录我用Python登录教务系统查询成绩的过程.手动输入验证码,简单获取成绩页面.后续将可能更新自动识别验证码登录查询 前期准备 本爬虫用到了Python的Requests库和BeautifulS ...

  4. 解析教务系统查看平时成绩(方正教务系统)

    好啦,身患懒癌的我终于迎来了更新. 干货,很干很干的货.期末考试完了很多小伙伴都在等成绩的出来,成绩出来又只有一个最终成绩,所以才有了这次的更新,教大家如何查看自己的平时成绩和卷面成绩!!!(P.S: ...

  5. winform模拟登陆网页_Python爬虫使用selenium爬取群成员信息(全自动实现自动登陆)...

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: python小爬虫 PS:如有需要Python学习资料的小伙伴可以 ...

  6. 燕山大学教务系统官网计算机学院,燕山大学教务系统登录入口:https://jwc.ysu.edu.cn/...

    11月20日晚7:00,以"我们的歌声唱响燕园"为主题的燕山大学音乐通识课"阿卡贝拉组合体验课"与"声乐表演课"教学成果展示音乐会,在东校区 ...

  7. JAVA使用HttpClient模拟登录正方教务系统,爬取学籍信息和课程表成绩等,超详细登录分析和代码注解

    目录 前言 分析 代码实现 第一次GET POST登录 第二次Get 第三次GET 第四次GET 第五次GET 测试 完整代码 前言 最近在做一个APP,需要获取我们学校--武汉纺织大学皇家停水断电断 ...

  8. 新版小爱课程表正方教务系统课表适配

    新版小爱课程表正方教务系统课表适配 前言 之前写过一篇小爱课程表的教务系统适配,但是是比较老的版本开发者工具适配了,最近看到小爱课程表开发者工具更新了,就想着写一篇新的博客,顺便优化一下之前的代码,还 ...

  9. nodejs模拟登陆旧版正方教务系统

    nodejs模拟登陆旧版正方教务系统 nodejs模拟登陆学校教务系统 1.分析教务系统地址 2.分析请求头和请求数据 3.对Cookie.__VIEWSTATE数据的获取 (1)获取cookie ( ...

  10. 正方教务系统——用Postman优雅的选课

    一.引言 由于每个学期开学都要在学校的土豆服务器上进行抢课大战(总抢不到),我对学校的教务系统(正方教务系统V-8.1.3)早已深恶痛绝,因此,去年用python模拟登陆(selenium)写了个网课 ...

最新文章

  1. 如何选择合适的分布式机器学习平台
  2. Javascript标准DOM Range操作
  3. [原创]Zynq SDIO WIFI SotfAP调试
  4. 微信小程序-canvas绘制文字实现自动换行
  5. wxWidgets:使用自定义对话框和 sizer
  6. php 腾讯云 文字识别_腾讯科技(成都)有限公司
  7. Spring Boot 项目中Java对象的字符串类型属性值转换为JSON对象的布尔类型键值的解决方法及过程
  8. EntityFramework 6.x多个上下文迁移实现分布式事务
  9. Windows下架设SVN服务
  10. 15. 注意string实现的多样性
  11. 相亲交友小程序,案例:情深深之恋
  12. 京东白条如何直接取现|分分卡开通说明
  13. [生存志] 第74节 孔子集结诗经
  14. WinAPI执行外部程序和创建新进程:CreateProcess()的使用
  15. Linux内核源代码概述
  16. qq令牌64位密钥提取_QQ令牌工具 活令牌查询动态密码(大哥牌)
  17. 小红书达人笔记投放攻略分享,纯干货
  18. c++英文单词填空游戏
  19. 海洋CMSv12.5后台多处代码执行漏洞复现
  20. 深入理解 Android 卷I - 第8章 深入理解Surface系统

热门文章

  1. 《Occlusion Aware Facial Expression RecognitionUsing CNN With Attention Mechanism》论文阅读(2019TIP)
  2. WinInet + MFC 写vc驿站助手
  3. 三菱FX5U PLC远程调试监控设备方案
  4. 中企故事汇:铁匠之乡借东风出海
  5. #9733;一名“标题党”自我修炼的10…
  6. HDFS 细粒度锁优化,FusionInsight MRS有妙招
  7. ERP与电子商务整合乃大势所趋
  8. 移动直播进入下半场盈利为王,突破打赏模式成关键
  9. mysql根据单一字段去重
  10. 辣鸡python导入不了函数库嘤嘤嘤(问题)