加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 资源网站 > 资源 > 正文

web-scraping – 如何使用Import.io抓取多个页面

发布时间:2020-12-14 23:27:02 所属栏目:资源 来源:网络整理
导读:我试图从站点 http://www.cityoflondon.gov.uk/events/中删除一个事件列表,但是当使用import.io废弃它时,我只能提取第一页. 我怎样才能一次提取所有页面? 解决方法 您可以使用Crawler或使用批量提取来使用此站点提取数据.以上网站使用了一种非常简单的分页
我试图从站点 http://www.cityoflondon.gov.uk/events/中删除一个事件列表,但是当使用import.io废弃它时,我只能提取第一页.

我怎样才能一次提取所有页面?

解决方法

您可以使用Crawler或使用批量提取来使用此站点提取数据.以上网站使用了一种非常简单的分页形式:
http://www.cityoflondon.gov.uk/events/Pages/default.aspx    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=13    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=49    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=25    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=37

这是我为上述URL创建的数据集,应包含所有相关信息.

319aebad-88ea-4053-a649-2087011ce041

如果您对个别网站有任何疑问,请联系support@import.io

谢谢!梅格

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读