php – 在解析网页时删除javascript代码
发布时间:2020-12-13 16:13:59 所属栏目:PHP教程 来源:网络整理
导读:通过CURL或file_get_contents捕获网页内容时,删除内联 javascrip代码的最简单方法是什么.我正在考虑正则表达式删除标签之间的所有内容;但正则表达式不是一个可靠的方法. 有没有更好的方法来解析一个HTML页面(只是删除javascript代码)?如果正则表达式仍然是
通过CURL或file_get_contents捕获网页内容时,删除内联
javascrip代码的最简单方法是什么.我正在考虑正则表达式删除标签之间的所有内容;但正则表达式不是一个可靠的方法.
有没有更好的方法来解析一个HTML页面(只是删除javascript代码)?如果正则表达式仍然是最佳选择,那么最可靠的命令是什么? 解决方法
您可以使用
DOMDocument及其
removeChild() 功能.像下面这样的东西应该让你去.
<?php $doc = new DOMDocument; $doc->load('index.html'); $page = $doc->documentElement; // we retrieve the chapter and remove it from the book $scripts = $page->getElementsByTagName('script'); foreach($scripts as $script) { $page->removeChild($script); } echo $doc->saveHTML(); ?> (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |