加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > PHP教程 > 正文

php – 如何从网页获取内部链接?

发布时间:2020-12-13 16:16:20 所属栏目:PHP教程 来源:网络整理
导读:我使用XPath来解析 HTML网页以获取所有内部链接. DOMXPath将返回href中提供的所有链接.如何将内部外部链接分开? 我介绍了一系列字符串检查来删除外部链接;但问题是有不同的方式来链接内部页面,如 page.html /page.html http://domain.com/page.html http://
我使用XPath来解析 HTML网页以获取所有内部链接. DOMXPath将返回href中提供的所有链接.如何将内部外部链接分开?

我介绍了一系列字符串检查来删除外部链接;但问题是有不同的方式来链接内部页面,如

page.html
    /page.html
    http://domain.com/page.html
    http://subdomain.domain.com/page.html
    ....

区分内部链接(指向当前域的任何链接,包括其子域)和外部链接(到任何其他域)的最安全的方法是什么.

解决方法

使用 substr()查看前4个字符是否为http.

如果是,请使用parse_url()功能检查主机是否相同.如果没有,那就是内部的.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读