加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Linux > 正文

linux – wget递归下载,但我不想关注所有链接

发布时间:2020-12-13 18:33:07 所属栏目:Linux 来源:网络整理
导读:我正在尝试使用wget镜像一个网站,但我不想下载大量文件,所以我使用wget的–reject选项来保存所有文件.但是wget仍然会下载所有文件,然后如果它与我的拒绝选项匹配则删除该文件. 有没有办法告诉wget如果匹配某些shell通配符不遵循某些链接?如果wget无法做到这
我正在尝试使用wget镜像一个网站,但我不想下载大量文件,所以我使用wget的–reject选项来保存所有文件.但是wget仍然会下载所有文件,然后如果它与我的拒绝选项匹配则删除该文件.

有没有办法告诉wget如果匹配某些shell通配符不遵循某些链接?如果wget无法做到这一点,是否有其他常见的linux命令可以做到这一点?

解决方法

您也可以尝试 HTTrack,IMO,更灵活,更直观的包含/排除逻辑.这样的东西……
httrack "https://example.com" -O ExampleMirrorDirectory 
"-*" 
"+https://example.com/images/*" 
"-*.swf"

规则将按顺序应用,并将覆盖以前的规则……

>排除一切
>但包括https://example.com/images/ *>但排除以swf结尾的任何内容

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读