php实现模拟登陆方正教务系统抓取课表
课程格子和超级课程表这两个应用,想必大学生都很熟悉,使用自己的学号和教务系统的密码,就可以将自己的课表导入,随时随地都可以在手机上查看。 其实稍微了解一点php的话,我们也可以做一个类似这样的web 应用。 1,解决掉验证码 其实这是正方的一个小bug,当我们进入登陆界面时,浏览器会去请求服务器,服务器会生成一个验证码图片。如果我们不去请求这个图片,那么正方后台也不会生成相应的 验证码,于是这样我们就有了可乘之机,让我高兴会儿~这时,我们在不填写验证码的情况下,可以很流畅的进入。大家可以在自己的电脑上禁止访问验证码的地址,然后试试这 是不是真的~当然,这只对正方有效。 2,php 的curl 模拟登陆 接下来就是相关代码了,相信很多人和我一样,只喜欢看例子,对于长篇大论的讲解,转头就走……不过这个习惯还是不好……废话不多说! 3,教务系统登陆页面的隐藏字段 举个栗子 代码如下: 这些东西在登陆的时候也是需要带上的,顺便贴出函数,顺便暴漏了博主的学校……皇家种地大学(主要是正则表达式的运用) function getView(){
$url = 'http://jw.hzau.edu.cn/default2.aspx'; $result = curl_request($url); $pattern = '/<input type="hidden" name="__VIEWSTATE" value="(.*?)" />/is'; preg_match_all($pattern,$result,$matches); $res[0] = $matches[1][0]; return $res[0] ; 4,cookie 的获取 getView();
$post['txtUserName'] = $xh; //填写学号
$post['TextBox2'] = $pwd; //填写密码
$post['txtSecretCode'] = '';
$post['lbLanguage'] = '';
$post['hidPdrs'] = '';
$post['hidsc'] = '';
$post['RadioButtonList1'] = iconv('utf-8','gb2312','学生');
$post['Button1'] = iconv('utf-8','登录');
$result = curl_request($url,$post,1);
return $result['cookie'];
}
5,让我们来试试查课表的功能,格式有点乱额,大家凑合着看,我把课表转成了一个二维关联数组 $cookie = $this->login($xh,$pwd);
$view = $this->getViewJs($cookie,$xh);//验证密码是否正确
//如果密码正确
if (!empty($view)) {
$url = "http://jw.hzau.edu.cn/xskbcx.aspx?xh={$xh}";
$result = curl_request($url,$cookie); //保存的cookies
preg_match_all('/<table id="Table1"[wW]*?>([wW]*?)</table>/',$out);
$table = $out[0][0]; //获取整个课表
preg_match_all('/<td [wW]*?>([wW]*?)</td>/',$table,$out);
$td = $out[1];
$length = count($td);
//获得课程列表
for ($i=0; $i < $length; $i++) {
$td[$i] = str_replace("<br>","",$td[$i]);
$reg = "/{(.*)}/";
if (!preg_match_all($reg,$td[$i],$matches)) {
unset($td[$i]);
}
}
$td = array_values($td); //将课程列表数组重新索引
$tdLength = count($td);
for ($i=0; $i < $tdLength; $i++) {
$td[$i] = iconv('GB2312','UTF-8',$td[$i]);
}
//将课表转换成数组形式
function converttoTable($table){
$list = array(
'sun' => array(
'1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => ''
),'mon' => array(
'1,'tues' => array(
'1,'wed' => array(
'1,'thur' => array(
'1,'fri' => array(
'1,'sat' => array(
'1,10' => ''
)
);
$week = array("sun"=>"周日","mon"=>"周一","tues"=>"周二","wed"=>"周三","thur"=>"周四","fri"=>"周五","sat"=>"周六");
$order = array('1,2',4',6',8',10');
foreach ($table as $key => $value) {
$class = $value;
foreach ($week as $key => $weekDay) {
$pos = strpos($class,$weekDay);
// echo $pos;
if ($pos) {
$weekArrayDay = $key; //获取list数组中的第一维key
foreach ($order as $key => $orderClass) {
$pos = strpos($class,$orderClass);
if ($pos) {
$weekArrayOrder = $orderClass; //获取该课程是第几节
break;
}
}
break;
}
}
$list[$weekArrayDay][$weekArrayOrder] = $class;
}
return $list;
}
//调用函数
return converttoTable($td);
}else{
return 0;
}
} 6,再试试查询空教室的功能 $cookie = $this->login($xh,$pwd);
$url = "http://jw.hzau.edu.cn/xs_main.aspx?xh={$xh}";
$result = curl_request($url,$cookie); //保存的cookies
$url="http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";
$post['Button2'] = iconv('utf-8','空教室查询');
$post['__EVENTARGUMENT']='';
$post['__EVENTTARGET']='';
$post['__VIEWSTATE'] = $this->getViewJs($cookie,$xh);
$post['ddlDsz'] = iconv('utf-8','单');
$post['ddlSyXn'] = '2014-2015'; //学年
$post['ddlSyxq'] = '1';
$post['jslb'] = '';
$post['xiaoq'] = '';
$post['kssj']=$_GET['start']; //提交的开始查询时间
$post['sjd']=$_GET['class'];//提交的课程节次
$post['xn']='2014-2015';//所在学年
$post['xq']='2';//所在学期
$post['xqj']='6';//当天星期几
$post['dpDataGrid1:txtPageSize']=90;//每页显示条数
$result = curl_request($url,$cookie,0);
preg_match_all('/<span[^>]+>[^>]+span>/',$out);
$tip = iconv('gb2312','utf-8',$out[0][3]);//获取页面前部的提示内容
preg_match_all('/<table[wW]*?>([wW]*?)</table>/',$out);
$table = iconv('gb2312',$out[0][0]); //获取查询列表
$this->load->view("classroom",array('tip'=>$tip,'table'=>$table));
} 总结起来就是这些了,每个学校的教务系统都不尽相同,这时我们可以借助火狐浏览器的 firebug 抓包,看看到底提交了哪些东西。 以上所述就是本文的全部内容了,希望大家能够喜欢。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |