PHP 采集程序原理分析篇
苦想了几天,终于弄明白了里面的道理。在这里写出来,请高手指正。 我们就可以写正则表达式了。$count=preg_match_all("/ 其中数组$art_list[1][$s]里面包含的就是某个文章的链接地址。而$art_list[2][$s]包含的就是某一文章的标题。到了这一步就可以算成功了一半了。 接着用for循环依次打每个链接,然后像取得标题一样的方法取得内容即可。以上这些和我在网上找的教程都差不多,但是到了这个for循环网上的教程可就差劲,还没找到一篇可以说清这个事的文章,刚开始我是用js来帮助循环的,还是用实例说吧,刚开始我是这样做的: for($i=0;$i<20;4i++ { 中间就是采集内容的部分了,省略了 采集了一页,肯定要采集再一页啊 可是再用fopen打开链接时就不行了。请求失败什么的,用js也不行,最后才知道要用这句echo "";其中aa.php就是我们的程序的文件名, id后面的数字就可以帮助我们实现循环,采集多个页面。这就是能真正循环起来的关键 } 脑子有点难受,写得有点乱,将就着看吧,在高手看来这可能没什么大不了的,可是对于我等菜鸟来说,实在是很有帮助。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |