加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > PHP教程 > 正文

php – 在解析网页时删除javascript代码

发布时间:2020-12-13 16:13:59 所属栏目:PHP教程 来源:网络整理
导读:通过CURL或file_get_contents捕获网页内容时,删除内联 javascrip代码的最简单方法是什么.我正在考虑正则表达式删除标签之间的所有内容;但正则表达式不是一个可靠的方法. 有没有更好的方法来解析一个HTML页面(只是删除javascript代码)?如果正则表达式仍然是
通过CURL或file_get_contents捕获网页内容时,删除内联 javascrip代码的最简单方法是什么.我正在考虑正则表达式删除标签之间的所有内容;但正则表达式不是一个可靠的方法.

有没有更好的方法来解析一个HTML页面(只是删除javascript代码)?如果正则表达式仍然是最佳选择,那么最可靠的命令是什么?

解决方法

您可以使用 DOMDocument及其 removeChild()功能.像下面这样的东西应该让你去.

<?php

$doc = new DOMDocument;
$doc->load('index.html');

$page = $doc->documentElement;

// we retrieve the chapter and remove it from the book
$scripts = $page->getElementsByTagName('script');
foreach($scripts as $script) {
   $page->removeChild($script);
}

echo $doc->saveHTML();
?>

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读