加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > PHP教程 > 正文

php – 编写程序来刮取论坛

发布时间:2020-12-13 21:37:23 所属栏目:PHP教程 来源:网络整理
导读:我需要编写一个程序来搜索论坛. 我应该使用Scrapy框架在Python中编写程序,还是应该使用Php cURL? 还有一个相当于Scrapy的Php? 谢谢 解决方法 由于优秀的libxml2绑定,我会选择Python,特别是像 lxml.html和 pyQuery这样的东西.Scrapy有自己的libxml2绑定,我
我需要编写一个程序来搜索论坛.

我应该使用Scrapy框架在Python中编写程序,还是应该使用Php cURL?
还有一个相当于Scrapy的Php?

谢谢

解决方法

由于优秀的libxml2绑定,我会选择Python,特别是像 lxml.html和 pyQuery这样的东西.Scrapy有自己的libxml2绑定,我没有看过它们来测试它们,虽然略读Scrapy文档并没有让我印象深刻(我’我们只是使用这些解析器和手动编码完成了大量的抓取工作.通过这些,您可以获得真正优秀的HTML解析器,通过XPath查询,以及使用lxml.html和pyquery(也基于lxml构建),您可以获得CSS选择器.

如果你在抓一个论坛做一个小工作,我会跳过一个抓取框架,只是手工完成 – 它很容易,并行化并不是真正需要的.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读