如何在保留html标签/结构的同时在html中查找/替换文本
发布时间:2020-12-14 18:49:09 所属栏目:资源 来源:网络整理
导读:我使用正则表达式来转换文本,但我想保留 HTML标记. 例如如果我想用“堆栈下溢”替换“堆栈溢出”,这应该工作 预期:如果输入是堆栈 sometag溢出 / sometag,我必须获得堆栈 sometag underflow / sometag (即完成字符串替换,但是 标签还在那里…… 解决方法 在
我使用正则表达式来转换文本,但我想保留
HTML标记.
例如如果我想用“堆栈下溢”替换“堆栈溢出”,这应该工作 预期:如果输入是堆栈< sometag>溢出< / sometag>,我必须获得堆栈< sometag> underflow< / sometag> (即完成字符串替换,但是 标签还在那里…… 解决方法
在处理HTML时,请使用DOM库,而不是正则表达式:
> lxml:解析器,文档和HTML序列化程序.也可以使用BeautifulSoup和html5lib进行解析. 从http://blog.ianbicking.org/2008/03/30/python-html-parser-performance/被盗. 其中我会推荐lxml,html5lib和BeautifulSoup. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |