php – 如何从网页获取内部链接?
发布时间:2020-12-13 16:16:20 所属栏目:PHP教程 来源:网络整理
导读:我使用XPath来解析 HTML网页以获取所有内部链接. DOMXPath将返回href中提供的所有链接.如何将内部外部链接分开? 我介绍了一系列字符串检查来删除外部链接;但问题是有不同的方式来链接内部页面,如 page.html /page.html http://domain.com/page.html http://
我使用XPath来解析
HTML网页以获取所有内部链接. DOMXPath将返回href中提供的所有链接.如何将内部外部链接分开?
我介绍了一系列字符串检查来删除外部链接;但问题是有不同的方式来链接内部页面,如 page.html /page.html http://domain.com/page.html http://subdomain.domain.com/page.html .... 区分内部链接(指向当前域的任何链接,包括其子域)和外部链接(到任何其他域)的最安全的方法是什么. 解决方法
使用
substr()查看前4个字符是否为http.
如果是,请使用parse_url()功能检查主机是否相同.如果没有,那就是内部的. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |