加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

Python Goose无法提取日期

发布时间:2020-12-20 13:37:09 所属栏目:Python 来源:网络整理
导读:我正在使用 Python Goose.你可以在 this link找到它 我想提取已发布的日期,但是当我运行时: g = Goose()entity = g.extract(url="mylink")date = entity.publish_date 我有结果没有 我在许多网站上尝试过它,结果是无 有什么建议? 解决方法 我刚刚查看了源
我正在使用 Python Goose.你可以在 this link找到它

我想提取已发布的日期,但是当我运行时:

g = Goose()
entity = g.extract(url="mylink")
date = entity.publish_date

我有结果没有

我在许多网站上尝试过它,结果是无

有什么建议?

解决方法

我刚刚查看了源代码的相关部分: crawler.py
publish_date提取目前已被注释掉

# TODO
# article.publish_date = config.publishDateExtractor.extract(doc)

进一步检查发现,如果您取消注释上述行,您将能够定义自定义日期提取器.但是,Goose中没有实现默认日期提取器.请参阅此方法:https://github.com/grangier/python-goose/blob/master/goose/configuration.py中的set_publishdate_extractor

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读