加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 如何使用Scrapy

发布时间:2020-12-20 12:37:16 所属栏目:Python 来源:网络整理
导读:我想知道如何开始基于Scrapy的爬虫.我通过apt-get install安装了该工具,并尝试运行一个示例: /usr/share/doc/scrapy/examples/googledir/googledir$scrapy listdirectory.google.com/usr/share/doc/scrapy/examples/googledir/googledir$scrapy crawl 我从s
我想知道如何开始基于Scrapy的爬虫.我通过apt-get install安装了该工具,并尝试运行一个示例:

/usr/share/doc/scrapy/examples/googledir/googledir$scrapy list
directory.google.com

/usr/share/doc/scrapy/examples/googledir/googledir$scrapy crawl

我从spiders / google_directory.py中破解了代码,但它似乎没有被执行,因为我没有看到我插入的任何打印件.我阅读了他们的文档,但我发现没有任何相关内容;你有什么想法?

此外,如果您认为对于抓取网站我应该使用其他工具,请告诉我.我对Python工具没有经验,Python是必须的.

谢谢!

解决方法

您在crawl命令中错过了蜘蛛名称.使用:

$scrapy crawl directory.google.com

另外,我建议你将示例项目复制到你的家中,而不是在/usr/share / doc / scrapy / examples /目录中工作,这样你就可以修改它并使用它:

$cp -r /usr/share/doc/scrapy/examples/googledir ~
$cd ~/googledir
$scrapy crawl directory.google.com

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读