XML,HTML和XHTML文档的有效内容类型
发布时间:2020-12-16 08:14:03 所属栏目:百科 来源:网络整理
导读:XML,HTML和XHTML文档的内容类型是什么? 我需要写一个简单的爬虫,只抓取这些类型的文件。 现在http://somedomain.com/index.html可以提供一个JPEG文件,由于mod_rewrite,所以我需要检查内容类型从响应头,并将其与允许的内容类型的列表进行比较。 我在哪
XML,HTML和XHTML文档的内容类型是什么?
我需要写一个简单的爬虫,只抓取这些类型的文件。 现在http://somedomain.com/index.html可以提供一个JPEG文件,由于mod_rewrite,所以我需要检查内容类型从响应头,并将其与允许的内容类型的列表进行比较。 我在哪里可以得到这样的列表?
HTML:text / html,全停。
XHTML:application / xhtml xml,或者仅当遵循HTML兼容性指南,text / html。参见W3 Media Types Note。 XML:text / xml,application / xml(RFC 2376)。 还有许多基于XML的其他媒体类型,例如application / rss xml或image / svg xml。这是一个安全的赌注,任何无法识别但注册结束于xml是基于XML。对于以xml结尾的注册媒体类型,请参阅IANA list。 (对于未注册的x类型,所有投注都关闭,但你希望xml将被尊重。) (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |