ruby – 在Nokogiri的标签内直接获取文本
发布时间:2020-12-16 20:30:00 所属栏目:百科 来源:网络整理
导读:我有一些HTML看起来像: dt a href="#"Hello/a (2009)/dt 我已经把所有的HTML加载到一个名为record的变量中.如果存在,我需要解析出2009年. 如何获取dt标签内的文本,而不是标签内的文本?我使用了record.search(“dt”).inner_text,这给了我一切. 这是一个微
我有一些HTML看起来像:
<dt> <a href="#">Hello</a> (2009) </dt> 我已经把所有的HTML加载到一个名为record的变量中.如果存在,我需要解析出2009年. 如何获取dt标签内的文本,而不是标签内的文本?我使用了record.search(“dt”).inner_text,这给了我一切. 这是一个微不足道的问题,但我没有想到这一点. 解决方法
为了让所有的直接孩子都有文字,但没有任何进一步的子孩,你可以像这样使用XPath:
doc.xpath('//dt/text()') 或者如果你想使用搜索: doc.search('dt').xpath('text()') (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |