bash – 使用wget和regex进行数据抓取
发布时间:2020-12-15 21:14:33 所属栏目:安全 来源:网络整理
导读:我只是在学习bash脚本,我试图从网站上抓取一些数据,主要是wikitionary.这就是我现在在命令行上尝试但它没有返回任何结果 wget -qO- http://en.wiktionary.org/wiki/robust | egrep 'ol{[a-zA-Z]*[0-9]*}*/ol' 我正在尝试的是获取标签之间的数据,只是希望它们
我只是在学习bash脚本,我试图从网站上抓取一些数据,主要是wikitionary.这就是我现在在命令行上尝试但它没有返回任何结果
wget -qO- http://en.wiktionary.org/wiki/robust | egrep '<ol>{[a-zA-Z]*[0-9]*}*</ol>' 我正在尝试的是获取标签之间的数据,只是希望它们被显示.能帮我看看我做错了吗? 谢谢 解决方法
你需要将输出发送到stdout:
wget -q http://en.wiktionary.org/wiki/robust -q -O - | ... 得到所有< ol>你可以做grep标签: wget -q http://en.wiktionary.org/wiki/robust -O - | tr 'n' ' ' | grep -o '<ol>.*</ol>' (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |