python – 使用Beautiful Soup进行刮擦
发布时间:2020-12-16 21:55:16 所属栏目:Python 来源:网络整理
导读:在使用同样的技术之前,我一直在抓网站.但是这个网站似乎不起作用. import urllib2from BeautifulSoup import BeautifulSoupurl = "http://www.weatheronline.co.uk/weather/maps/current?LANG=enDATE=1354104000CONT=euroLAND=UKKEY=UKSORT=1INT=06TYP=sonne
在使用同样的技术之前,我一直在抓网站.但是这个网站似乎不起作用.
在输出应该是网页的内容,但我只是得到这个: GIF89a(它也跟着我在这里不能复制的一些符号) 关于问题是什么以及我应该如何进行的任何想法. 最佳答案
因为这些人很聪明,不希望他们的网站在网络浏览器外访问.您需要做的是通过向标头添加User-agent来伪造已知的浏览器.这是一个可行的修改示例
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |