哈希对数据更改的敏感性

时间:2013-01-02 13:14:44

标签: hash language-agnostic

我见过很多哈希算法都有一个共同的特点,就是数据中的任何变化都会产生哈希码的总变化,虽然就是这样,我想知道是否有任何已知的标准哈希算法一种不同的行为,对于数据的微小变化几乎没有哈希变化,一种近似线性的哈希变化量,与数据变化量的关系。

这样做的一个想法是创建一个哈希,连接从数据部分计算的各种哈希值,它会使用小的部分哈希值,或者更大的最终哈希值,无论如何,我想知道是否有任何算法具有此功能行为。

1 个答案:

答案 0 :(得分:1)

我认为你正在寻找像Simhash这样的东西。它实际上意味着找到“接近重复”。

e.g。 http://irl.cs.tamu.edu/people/sadhan/papers/cikm2011.pdf