加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > 安全 > 正文

bash – 使用wget和regex进行数据抓取

发布时间:2020-12-15 21:14:33 所属栏目:安全 来源:网络整理
导读:我只是在学习bash脚本,我试图从网站上抓取一些数据,主要是wikitionary.这就是我现在在命令行上尝试但它没有返回任何结果 wget -qO- http://en.wiktionary.org/wiki/robust | egrep 'ol{[a-zA-Z]*[0-9]*}*/ol' 我正在尝试的是获取标签之间的数据,只是希望它们
我只是在学习bash脚本,我试图从网站上抓取一些数据,主要是wikitionary.这就是我现在在命令行上尝试但它没有返回任何结果

wget -qO- http://en.wiktionary.org/wiki/robust | egrep '<ol>{[a-zA-Z]*[0-9]*}*</ol>'

我正在尝试的是获取标签之间的数据,只是希望它们被显示.能帮我看看我做错了吗?

谢谢

解决方法

你需要将输出发送到stdout:

wget -q http://en.wiktionary.org/wiki/robust -q -O - | ...

得到所有< ol>你可以做grep标签:

wget -q http://en.wiktionary.org/wiki/robust -O - | tr 'n' ' ' | grep -o '<ol>.*</ol>'

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读