克服Bitap算法搜索模式的长度

时间:2009-05-03 18:57:15

标签: string fuzzy-search

我是近似字符串匹配领域的新手。

我正在探索Bitap algorithm的用途,但到目前为止,它有限的模式长度让我感到困扰。我正在使用Flash,我处理32位无符号整数和IEEE-754双精度浮点数类型,它可以为整数投入多达53位。不过,我宁愿使用模糊匹配算法来处理比50个字符更长的模式。

Bitap算法的Wikipedia page提到了libbitap,据说它可以演示算法的无限模式长度实现,但是我无法从其来源获得这个想法。

您是否有任何关于如何针对无限长度模式推广Bitap的建议,或者关于可以在大海捞针建议位置附近执行针的模糊字符串匹配的另一种算法?

1 个答案:

答案 0 :(得分:2)

google code提供了这种算法的漂亮crear实现。 试试吧。虽然我无法理解如何获得模糊匹配的确切位置(文本的开始和结束点)。如果你知道如何获得开始和结束点,请分享。

相关问题