加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

ruby – 在Nokogiri的标签内直接获取文本

发布时间:2020-12-16 20:30:00 所属栏目:百科 来源:网络整理
导读:我有一些HTML看起来像: dt a href="#"Hello/a (2009)/dt 我已经把所有的HTML加载到一个名为record的变量中.如果存在,我需要解析出2009年. 如何获取dt标签内的文本,而不是标签内的文本?我使用了record.search(“dt”).inner_text,这给了我一切. 这是一个微
我有一些HTML看起来像:
<dt>
  <a href="#">Hello</a>
  (2009)
</dt>

我已经把所有的HTML加载到一个名为record的变量中.如果存在,我需要解析出2009年.

如何获取dt标签内的文本,而不是标签内的文本?我使用了record.search(“dt”).inner_text,这给了我一切.

这是一个微不足道的问题,但我没有想到这一点.

解决方法

为了让所有的直接孩子都有文字,但没有任何进一步的子孩,你可以像这样使用XPath:
doc.xpath('//dt/text()')

或者如果你想使用搜索:

doc.search('dt').xpath('text()')

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读