两个文本文件之间的百分比差异

时间:2009-08-26 13:34:16

标签: python linux algorithm language-agnostic

我知道我可以使用cmp,diff等来比较两个文件,但我要找的是一个实用程序,它给出了两个文件之间的百分比差异。

如果没有这样的实用程序,任何算法都可以做得很好。我读过有关模糊编程的内容,但我还不太了解它。

3 个答案:

答案 0 :(得分:32)

您可以使用difflib.SequenceMatcher ratio方法

来自文档:

  

返回一个指标   序列的相似性作为浮点数   范围[0,1]。

例如:

from difflib import SequenceMatcher
text1 = open(file1).read()
text2 = open(file2).read()
m = SequenceMatcher(None, text1, text2)
m.ratio()

答案 1 :(得分:3)

看起来Linux有一个名为dwdiff的实用程序可以通过使用“-s”标志来提供百分比差异

http://www.softpanorama.org/Utilities/diff_tools.shtml

答案 2 :(得分:1)

Beyond Compare将非常好的文件差异统计信息导出到csv。报告了行级别的差异,因此比较源代码文件很好。

相关问题