加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – lxml xpath返回一个空列表

发布时间:2020-12-16 22:32:03 所属栏目:Python 来源:网络整理
导读:如果我跑: from lxml import etreehtml = etree.parse('text.txt')result = html.xpath('//title')print(result) 我会得到一个空列表. 我想它与命名空间有关,但我无法弄清楚如何解决它. 最佳答案 尝试使用html解析器创建树. 另请注意,如果text.txt是文件,则

如果我跑:

from lxml import etree
html = etree.parse('text.txt')
result = html.xpath('//title')
print(result)

我会得到一个空列表.
我想它与命名空间有关,但我无法弄清楚如何解决它.

最佳答案
尝试使用html解析器创建树.
另请注意,如果text.txt是文件,则需要先读取它.

with open('text.txt','r',encoding='utf8') as f:
    text_html = f.read()

像这样:

from lxml import etree,html

def build_lxml_tree(_html):
    tree = html.fromstring(_html)
    tree = etree.ElementTree(tree)
    return tree

tree = build_lxml_tree(text_html)
result = tree.xpath('//title')
print(result)

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读