本篇章节讲解PHP实现抓取百度搜索结果页面【相关搜索词】并存储到txt文件。分享给大家供大家参考,具体如下:
一、百度搜索关键词【编程之家】

【编程之家】搜索链接
https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=0&rsv_idx=1&tn=baidu&wd=%E8%84%9A%E6%9C%AC%E4%B9%8B%E5%AE%B6&rsv_pq=ab33cfeb000086a2&rsv_t=7c65vT3KzHCNfGYOIn%2FDSS%2BOQUiCycaspxWzSOBfkHYpgRIPKMI74WIi8K8&rqlang=cn&rsv_enter=1&rsv_sug3=1

搜索结果部分源代码:
游戏脚本一般都在哪找脚本怎么写 | 脚本是什么意思 | 编程之家app手机脚本制作 | 手机脚本大全脚本游戏制作大师 | 游戏脚本制作教程 | 脚本精灵 |
二、抓取并保存本地

源代码
index.php:
o_String=new StringEx();
}
public function getItem($word){
$url = "http://www.baidu.com/s?wd=".$word;
// 构造包头,模拟浏览器请求
$header = array (
"Host:www.baidu.com","Content-Type:application/x-www-form-urlencoded",//post请求
"Connection: keep-alive",'Referer:http://www.baidu.com','User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; BIDUBrowser 2.6)'
);
$ch = curl_init ();
curl_setopt ( $ch,CURLOPT_URL,$url );
curl_setopt ( $ch,CURLOPT_HTTPHEADER,$header );
curl_setopt ( $ch,CURLOPT_RETURNTRANSFER,1 );
$content = curl_exec ( $ch );
if ($content == FALSE) {
echo "error:" . curl_error ( $ch );
}
curl_close ( $ch );
//输出结果echo $content;
$this->o_String->string=$content;
$s_begin=' ';
$summary=$this->o_String->getPart($s_begin,$s_end);
$s_begin=' ';
$s_end='';
$content=$this->o_String->getPart($s_begin,$s_end);
return $content;
}
public function __destruct(){
unset($this->o_String);
}
}
if($_POST){
$com = new ComBaike();
$q = $_POST['q'];
$str = $com->getItem($q); //获取搜索内容
$pat = '/(.*?)/i';
preg_match_all($pat,$str,$m);
//print_r($m[4]); 链接文字
$con = implode(",",$m[4]);
//生成文件夹
$dates = date("Ymd");
$path="./Search/".$dates."/";
if(!is_dir($path)){
mkdir($path,0777,true);
}
//生成文件
$file = fopen($path.iconv("UTF-8","GBK",$q).".txt",'w');
if(fwrite($file,$con)){
echo $con;
echo '';
}else{
echo '';
}
fclose($file);
}
?>
cls.StringEx.php:
string=$string;
}
public function pregGetPart($s_begin,$s_end){
$s_begin==preg_quote($s_begin);
$s_begin=str_replace('/','/',$s_begin);
$s_end=preg_quote($s_end);
$s_end=str_replace('/',$s_end);
$pattern='/'.$s_begin.'(.*?)'.$s_end.'/';
$result=preg_match($pattern,$this->string,$a_match);
if(!$result){
return $result;
}else{
return isset($a_match[1])?$a_match[1]:'';
}
}
public function strstrGetPart($s_begin,$s_end){
$string=strstr($this->string,$s_begin);
$string=strstr($string,$s_end,true);
$string=str_replace($s_begin,'',$string);
$string=str_replace($s_end,$string);
return $string;
}
public function getPart($s_begin,$s_end){
$result=$this->pregGetPart($s_begin,$s_end);
if(!$result){
$result=$this->strstrGetPart($s_begin,$s_end);
}
return $result;
}
}
?>
更多关于PHP相关内容感兴趣的读者可查看本站专题:《》、《》、《》、《》、《》及《》
希望本文所述对大家PHP程序设计有所帮助。 (编辑:李大同)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|