加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > PHP教程 > 正文

php – 保存完整的网页

发布时间:2020-12-13 22:15:21 所属栏目:PHP教程 来源:网络整理
导读:我在项目工作时碰到了一个问题.我想“抓
我在项目工作时碰到了一个问题.我想“抓取”某些感兴趣的网站并将其保存为“完整网页”,包括样式和图像,以便为它们构建镜像.我多次给网站添加书签以便稍后阅读,几天之后网站就被关闭了,因为它遭到了黑客入侵而且所有者没有备份数据库.

当然,我可以使用fopen(“http://website.com”,“r”)或fsockopen()轻松地使用php读取文件,但主要目标是保存完整的网页,以防万一,它仍然可供其他人使用,如“编程时间机器”:)

有没有办法在没有读取的情况下执行此操作并保存页面上的每个链接?

Objective-C解决方案也很受欢迎,因为我也试图弄清楚它的更多内容.

谢谢!

解决方法

您实际上需要解析引用的html和所有css文件,这并不容易.然而,快速的方法是使用像wget这样的外部工具.安装wget后,您可以从命令行运行
wget –no-parent –timestamping –convert-links –page-requisites –no-directories –no-host-directories -erobots = off http://example.com/mypage.html

这将下载mypage.html和所有链接的CSS文件,图像和css内链接的图像.
在您的系统上安装wget后,您可以使用php的system()函数以编程方式控制wget.

注意:您至少需要wget 1.12才能正确保存通过css文件引用的图像.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读