php – 计算两个HTML文件的百分比差异
发布时间:2020-12-13 22:48:12 所属栏目:PHP教程 来源:网络整理
导读:我正在用 PHP编写一个工具来比较HTML文件并显示差异.现在我正在寻找一种有效的方法来计算两个HTML文件之间的百分比差异.这些文件可以是任意长的(我拥有的文件可以长达300000个字符). 经过一些研究,我偶然发现Levensthein距离是一个O(n * m)的算法,需要空间O(
我正在用
PHP编写一个工具来比较HTML文件并显示差异.现在我正在寻找一种有效的方法来计算两个HTML文件之间的百分比差异.这些文件可以是任意长的(我拥有的文件可以长达300000个字符).
经过一些研究,我偶然发现Levensthein距离是一个O(n * m)的算法,需要空间O(n * m):php版本最多只能支持255个字符和我自己的O(n)空间实现,太慢了. 所以现在我正在寻找另一种更有效的算法来比较HTML文件.近似算法也很好.谁能给我一些关于如何做到这一点的建议? 解决方法
您可以设置xdiff扩展名:
http://www.php.net/manual/en/function.xdiff-file-diff.php 然后获取两个文件的差异,并根据该差异,您可以很容易地得到百分比. 例: >第一个文件A:400字 差异结果:从A到B的200个字差异 这会给你50%的相似度. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |