关于pipeline持久化
发布时间:2020-12-14 05:00:10 所属栏目:百科 来源:网络整理
导读:将糗事百科主页的段子标题和作者数据爬取下来,然后进行持久化存储 流程: ??? ? 1. 爬虫文件爬取到数据后,需要将数据封装到items对象中。 ???? 2. 使用 yield 关键字将items对象提交给pipelines管道进行持久化操作。 ???? 3. 在管道文件中的process_item方
将糗事百科主页的段子标题和作者数据爬取下来,然后进行持久化存储流程: ????
1. 爬虫文件爬取到数据后,需要将数据封装到items对象中。
???? 2. 使用 yield 关键字将items对象提交给pipelines管道进行持久化操作。
???? 3. 在管道文件中的process_item方法中接收爬虫文件提交过来的item对象,然后编写持久化存储的代码将item对象中存储的数据进行持久化存储
???? 4.settings .py配置文件中开启管道。
5.注:可能出错的地方
?
- 爬虫文件:qiubai.py
? ? ?
? ? ? ? - items文件:items.py ?
? - settings.py
? ? - 如果在执行的过程中出现这种错误:
- middlewares.py 在该py文件中加入这个类
-settings.py
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |