脚本宝典收集整理的这篇文章主要介绍了php – 计算两个HTML文件的百分比差异,脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
经过一些研究,我偶然发现Levensthein距离是一个O(n * m)的算法,需要空间O(n * m):PHP版本最多只能支持255个字符和我自己的O(n)空间实现,太慢了.
之后,我尝试了PHP函数similar_text,但对于非常大的HTML文件,该算法也太慢了.
所以现在我正在寻找另一种更有效的算法来比较HTML文件.近似算法也很好.谁能给我一些关于如何做到这一点的建议?
http://www.php.net/manual/en/function.xdiff-file-diff.php
然后获取两个文件的差异,并根据该差异,您可以很容易地得到百分比.
例:
差异结果:从A到B的200个字差异
这会给你50%的相似度.
以上是脚本宝典为你收集整理的php – 计算两个HTML文件的百分比差异全部内容,希望文章能够帮你解决php – 计算两个HTML文件的百分比差异所遇到的问题。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。