屏幕抓取 – 屏幕抓取器如何工作?
发布时间:2020-12-14 21:22:33 所属栏目:资源 来源:网络整理
导读:我听说人们一直在写这些程序,我知道他们做了什么,但他们是如何做到的呢?我正在寻找一般概念. 解决方法 从技术上讲,screenscraping是任何程序,它抓取另一个程序的显示数据并摄取它自己使用. 通常,屏幕截图是指解析目标网站的HTML页面以提取格式化数据的Web客
我听说人们一直在写这些程序,我知道他们做了什么,但他们是如何做到的呢?我正在寻找一般概念.
解决方法
从技术上讲,screenscraping是任何程序,它抓取另一个程序的显示数据并摄取它自己使用.
通常,屏幕截图是指解析目标网站的HTML页面以提取格式化数据的Web客户端.当网站不提供RSS源或REST API以便以编程方式访问数据时,就可以完成此操作. 用于此目的的库的一个示例是Ruby的Hpricot,它是用于屏幕抓取的更好架构的HTML解析器之一. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
相关内容
- 电子邮件 – 为什么SpamAssassin和Razor2会对HTML正文中的特
- exchange-2007 – Exchange 2007服务器端触发器,用于在会议
- Web级分析应用程序的数据库选择
- 从Angular 2打字稿中获取HTML中的复选框值.
- html – 如何使用angularjs将标签标题与其主体分开?
- domain-name-system – 用于将电子邮件转发到Gmail帐户的SP
- 微信小程序 出现错误:{"baseresponse":{"errc
- HTML Treebuilder XPath提取链接
- JQuery 图片延迟加载并等比缩放插件
- 详解微信小程序开发之城市选择器 城市切换