加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

XML,HTML和XHTML文档的有效内容类型

发布时间:2020-12-16 02:00:31 所属栏目:百科 来源:网络整理
导读:XML,HTML和XHTML文档的内容类型是什么? 我需要写一个简单的爬虫,只抓取这些类型的文件。 现在http://somedomain.com/index.html可以提供一个JPEG文件,由于mod_rewrite,所以我需要检查内容类型从响应头,并将其与允许的内容类型的列表进行比较。 我在哪
XML,HTML和XHTML文档的内容类型是什么?

我需要写一个简单的爬虫,只抓取这些类型的文件。

现在http://somedomain.com/index.html可以提供一个JPEG文件,由于mod_rewrite,所以我需要检查内容类型从响应头,并将其与允许的内容类型的列表进行比较。

我在哪里可以得到这样的列表?

HTML:text / html,全停。

XHTML:application / xhtml xml,或者仅当遵循HTML兼容性指南,text / html。参见W3 Media Types Note。

XML:text / xml,application / xml(RFC 2376)。

还有许多基于XML的其他媒体类型,例如application / rss xml或image / svg xml。这是一个安全的赌注,任何无法识别但注册结束于xml是基于XML。对于以xml结尾的注册媒体类型,请参阅IANA list。

(对于未注册的x类型,所有投注都关闭,但你希望xml将被尊重。)

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读