加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > PHP教程 > 正文

PHP 采集获取指定网址的内容

发布时间:2020-12-13 05:38:30 所属栏目:PHP教程 来源:网络整理
导读:参考别人想法变成自己的想法,你会发现慢慢下来以后你就拥有了临时解决很多问题的思路与方法。 div class="codetitle" a style="CURSOR: pointer" data="33486" class="copybut" id="copybut33486" onclick="doCopy('code33486')" 代码如下: div class="code

参考别人想法变成自己的想法,你会发现慢慢下来以后你就拥有了临时解决很多问题的思路与方法。
<div class="codetitle"><a style="CURSOR: pointer" data="33486" class="copybut" id="copybut33486" onclick="doCopy('code33486')"> 代码如下:<div class="codebody" id="code33486">
<?php
/
功能:获取页面内容,存储下来阅读; lost63
/
Class GetUrl{
var $url; //地址
var $result; //结果
var $content; //内容
var $list; //列表
function GetUrl($url){
$this->url=$url;
$this->GetContent();
$this->GetList();
$this->FileSave();
//print_r($this->list[2]);
}
private function GetContent(){
$this->result=fopen($this->url,"r");
while(!feof($this->result)){
$this->content.=fgets($this->result,9999);
}
}
private function GetList(){
preg_match_all('/<a(.?)href="(.?)">(.?)</a>/',$this->content,$this->list);
$this->list[2]=array_unique($this->list[2]); //移除相同的值
while(list($key,$value)=each($this->list[2])){
if(strpos($value,".html")==0||strpos($value,"jiaocheng")==0){
unset($this->list[2][$key]);
}else{
$this->list[2][$key]=substr($value,strpos($value,".html")).".html"; //去掉不需要的标签
}
}
}
private function FileSave(){
foreach($this->list[2] as $value){
$this->url=$value; //重新赋值
$this->content=null;
$this->GetContent(); //提取内容
preg_match_all('/(.</em>?)</title>/',$files); //取标题 <BR>$filename=$files[1][0].".html"; //存储名 <BR>$content=$this->str_cut($this->content,'http://pagead2.googlesyndication.com/pagead/show_ads.js','<div id="article_detail">'); <BR>$file=fopen($filename,"w"); <BR>fwrite($file,$content); <BR>fclose($file); <BR>echo $filename."保存 OK<br>n"; <BR>} <BR>} <BR>function str_cut($str,$start,$end) { <BR>$content = strstr( $str,$start ); <BR>$content = substr( $content,strlen( $start ),strpos( $content,$end ) - strlen( $start ) ); <BR>return $content; <BR>} <BR>} <BR>$w=new GetUrl("http://www.ijavascript.cn/jiaocheng/javascript-jiaocheng-352.html"); <BR>?><BR></div></p> <p style="text-align:right;">(编辑:李大同)</p> <p style="text-align:right;">【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!</p> </td> </tr> </table> </div> <div class="dede_pagess"><ul class="pagelist"></ul></div> <div class="ad-690"><script src='https://ess.0577qiche.com/d/js/acmsd/ad76.js' language='javascript'></script></div> <div class="g-box10"> <div class="t-2">相关内容</div> <ul class="b-box12"></ul> <ul class="b-box13"><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/87337.html" target="_blank">php 移除数组重复元素的一点说明</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/113931.html" target="_blank">php – Codeigniter从HTML电子邮件中删除字符</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/145233.html" target="_blank">在PHP中使用gzcompress;需要能够在iPhone上解压缩</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/115982.html" target="_blank">php – 排序字符串,首先是字母,然后是字母内的字母</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1212/78297.html" target="_blank">PHP中的日期时间处理利器实例(Carbon)</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/120701.html" target="_blank">php – 未定义的字体:在Fpdf中</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/145596.html" target="_blank">php – 如何为SOAP Client函数创建适当的xml?</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1212/72319.html" target="_blank">CI框架给视图添加动态数据</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/98063.html" target="_blank">php – 在DateTime中设置分钟数?</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/97305.html" target="_blank">php – file_get_contents和fread有什么区别?</a></li><div class="cl"></div></ul> </div> </div> </div> <div class="right-1 fr"> <div class="g-box8"> <div class="t-2">推荐文章</div> <ul></ul> </div> <div class="g-box11"> <div class="t-2">站长推荐</div> <ul class="b-box7"><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/146965.html" target="_blank">php – Zend Mail Gmail SMTP</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/89873.html" target="_blank">比较简单的百度网盘文件直链PHP代码</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1212/69287.html" target="_blank">smarty获得当前url的方法分享</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/137617.html" target="_blank">php把excel数值格式转成日期格式</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1212/77420.html" target="_blank">php rsa 加密,解密,签名,验签详解</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/132400.html" target="_blank">php 资金格式转换函数</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1212/73746.html" target="_blank">php计算函数执行时间的方法</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/142083.html" target="_blank">yii – Findallbyattributes With Related Model</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1213/108724.html" target="_blank">php – 如何从给定的子键中查找数组的所有父键?</a></li><li><a href="https://www.lidatong.com.cn/html/jc/php/2020/1212/73820.html" target="_blank">使用GD库生成带阴影文字的图片</a></li></ul> </div> <script type="text/javascript">jQuery(".g-box8").slide({ titCell:"li",triggerTime:0 }); </script> <div class="ad-250"><script src='https://ess.0577qiche.com/d/js/acmsd/ad103.js' language='javascript'></script></div> <div class="g-box3 u-3"> <div class="t-1">热点阅读</div> <ul class="b-box2"></ul> </div> <div class="ad-250"><script src='https://ess.0577qiche.com/d/js/acmsd/ad77.js' language='javascript'></script></div> </div> <div class="cl"></div> </div> <div class="ad-960"><script src='https://ess.0577qiche.com/d/js/acmsd/ad78.js' language='javascript'></script></div> <div class="footer"> <p>【免责声明】本站内容转载自互联网,其发布内容言论不代表本站观点,如果其链接、内容的侵犯您的权益,烦请提交相关链接至邮箱bqsm@foxmail.com我们将及时予以处理。</p> <p>建议您使用1920×1080分辨率、谷歌浏览器Google Chrome、Microsoft Edge以获得本站的最佳浏览效果</p> <p>Copygight © 2008-2022 https://www.lidatong.com.cn/ All Rights Reserved. 李大同</p> <p><script type="text/javascript" src="//js.users.51.la/21280179.js"></script></p> </div> </body> </html>