加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 资源网站 > 资源 > 正文

如何使用scrapy Selector获取节点的innerHTML?

发布时间:2020-12-14 23:10:34 所属栏目:资源 来源:网络整理
导读:假设有一些html片段,如: 其中我想在标签中提取文本但在保留文本时排除这些标签,例如,我想要在上面提取的内容就像“c中b文本中的文本”和“b中文本中的文本” text inc“.现在我可以使用scrapy Selector css()函数获取节点,那么我怎么能继续这些节点来获得我

假设有一些html片段,如:

其中我想在标签中提取文本但在保留文本时排除这些标签,例如,我想要在上面提取的内容就像“c中b文本中的文本”和“b中文本中的文本” text inc“.现在我可以使用scrapy Selector css()函数获取节点,那么我怎么能继续这些节点来获得我想要的呢?任何想法将不胜感激,谢谢!

最佳答案
这是我设法做的:

from scrapy.selector import Selector

sel = Selector(text = html_string)

for node in sel.css('a *::text'):
    print node.extract()

假设html_string是一个在你的问题中持有html的变量,这段代码产生以下输出:

   text in a

text in b


text in c




text in b

   text in a

text in c

选择器a * :: text()匹配作为节点后代的所有文本节点.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读