加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Linux > 正文

linux – 如何使用wget下载而不使用带参数的链接

发布时间:2020-12-13 18:27:01 所属栏目:Linux 来源:网络整理
导读:我正在尝试下载两个网站以包含在CD中: http://boinc.berkeley.edu/trac/wikihttp://www.boinc-wiki.info 我遇到的问题是这些都是维基.所以当下载例如: wget -r -k -np -nv -R jpg,jpeg,gif,png,tif http://www.boinc-wiki.info/ 我确实得到了很多文件,因为
我正在尝试下载两个网站以包含在CD中:
http://boinc.berkeley.edu/trac/wiki
http://www.boinc-wiki.info

我遇到的问题是这些都是维基.所以当下载例如:

wget -r -k -np -nv -R jpg,jpeg,gif,png,tif http://www.boinc-wiki.info/

我确实得到了很多文件,因为它也跟着像…一样的链接?action = edit …?action = diff& version = …

有人知道解决这个问题的方法吗?

我只想要当前页面,没有图像,没有差异等.

P.S:

wget -r -k -np -nv -l 1 -R jpg,tif,pdf,ppt http://boinc.berkeley.edu/trac/wiki/TitleIndex

这适用于伯克利但boinc-wiki.info仍然给我带来麻烦:/

P.P.S:

我得到了最相关的页面:

wget -r -k -nv  -l 2 -R jpg,ppt http://www.boinc-wiki.info

解决方法

wget --reject-regex '(.*)?(.*)' http://example.com

(默认情况下为–reject-type posix).根据其他评论,仅适用于最近的(> = 1.14)版本的wget.

请注意,似乎每个wget调用只能使用–reject-regex一次.也就是说,你必须使用|如果你想选择几个正则表达式,在单个正则表达式中:

wget --reject-regex 'expr1|expr2|…' http://example.com

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读