python – 可以阻止Genshi解析HTML实体吗？

发布时间：2020-12-20 12:15:48 所属栏目：Python 来源：网络整理

导读：我使用Genshi(简化)有以下 Python代码： with open(pathToHTMLFile,'r') as f: template = MarkupTemplate(f.read())finalPage = template.generate().render('html',doctype = 'html') 源HTML文件包含 copy;, trade等实体;和 reg;. Genshi用它们的UTF-8字符

我使用Genshi(简化)有以下 Python代码：

with open(pathToHTMLFile,'r') as f:
    template = MarkupTemplate(f.read())
finalPage = template.generate().render('html',doctype = 'html')

源HTML文件包含& copy;,& trade等实体;和& reg;. Genshi用它们的UTF-8字符替换它们,这会导致查看器出现问题(输出用作独立文件,而不是对Web请求的响应),最终会看到生成的HTML.有没有办法阻止Genshi解析这些实体？更常见的是像& amp;通过就好了.

解决方法

实际上& amp; amp;没有通过,它被解析成一个&符号,然后序列化回& amp; amp; amp; amp;在出路上,因为在HTML中表示文字&符号是必要的.另一方面,& copy;不是必要的转义,因此它可以保留为文字字符.

所以不,没有办法阻止实体引用被解析.但是您可以通过序列化到纯ASCII来确保在返回的路上重新转义非ASCII字符：

template.generate().render('html',doctype= 'html',encoding= 'us-ascii')

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!